آشنائی با فناوری یادگیری ماشین و کاربرد آن در دستگاههای همراه
نمایش خبر
تاریخ : 1396/10/26 نویسنده: نعمت الله کمال فر | ||
برچسبها : | هوش مصنوعی Artificial Intelligence ، گوگل Google ، یادگیری عمیق Deep Learning ، یادگیری ماشین Machine Learning |
واحد خبر mobile.ir : این روزها هوش مصنوعی و یادگیری ماشین از مهمترین و موردتوجهترین زمینههای تحقیق و توسعه در دنیای تکنولوژی به شمار میروند. محققین و مهندسین فعال در گرایشهای مختلف به دنبال آن هستند تا با بهرهگیری از این تکنولوژیها، قابلیت یادگیری را به ماشینها، تجهیزات الکترونیکی و نرمافزارهای مورد نظر خود افزوده و آنها را به معنای واقعی هوشمند نمایند. دستگاههای همراه نیز به عنوان پرمخاطبترین و پرکاربردترین محصولات دنیای تکنولوژی از این قافله عقب نماندهاند. گوشیهای هوشمند امروزی که از نظر قدرت پردازشی در رده کامپیوترهای شخصی چند سال قبل و حتی ابرکامپیوترهای چند دهه قبل قرار گرفتهاند، اکنون در شرف این هستند تا به کمک روشهای یادگیری ماشین و یادگیری عمیق خود را آموزش داده، به ماشینهایی هوشمندتر و کارآمدتر بدل شوند.
یادگیری ماشین چیست؟
پیش از پیدایش و توسعه دانش هوش مصنوعی و یادگیری ماشین، تنها راه بهکارگیری کامپیوترها برای انجام وظایف مختلف استفاده از برنامههایی بود که در آنها برنامهنویس جزئیات عملیات لازم برای اجرا را به طور صریح و گامبهگام برای کامپیوتر مشخص مینمود. اگرچه این نوع برنامههای قطعی و صریح یا به اصطلاح hard-code شده برای انجام بسیاری از امور محاسباتی مناسب بوده و حتی توانایی شکست دادن استادبزرگهای شطرنج را به کامپیوترها میبخشید، اما در زمینههایی همچون تشخیص چهرهها و احساسات، یا در پاسخگویی به سوالات خاص و غیر قابل پیشبینی چندان کارآمد نبود. به همین دلیل دانشمندان علوم کامپیوتر به سراغ خلق روشها و الگوریتمهایی رفتند که قادر باشد قابلیت درک، یادگیری و تصمیمگیری را برای کامپیوترها به ارمغان آورند.
"Machine Learning" یا "یادگیری ماشین" یکی از شاخههای دانش هوش مصنوعیست که بر فراهم آوردن قابلیت یادگیری برای کامپیوترها تمرکز دارد. دستگاههای هوشمند میتوانند به کمک الگوریتمهای یادگیری ماشین دادههای مختلفی که از کاربر، محیط یا پایگاههای داده دریافت نمودهاند را تفسیر نموده، نکاتی را از آنها آموخته و از دانش بهدست آمده برای تصمیمگیری آگاهانه بهره بگیرند. به عنوان مثال اپلیکیشنهای استریمینگ موسیقی همچون Pandora و Spotify با استفاده از چنین الگوریتمهایی سعی میکنند سلایق موسیقیایی کاربران خود را فراگرفته و بر آن اساس با پیشبینی اینکه هر کاربر از چه موسیقیهایی لذت خواهد برد، آهنگهای دیگری را به او پیشنهاد دهند.
یادگیری عمیق چیست؟
"Deep Learning" یا "یادگیری عمیق" یکی از روشهای یادگیری ماشین است که سعی دارد عملیات یادگیری را با الهام از مغز انسان انجام دهد. در حالی که برای یک سیستم یادگیری ماشین عادی لازم است مشخص شود که چگونه یک پیشبینی یا تصمیمگیری دقیق را انجام دهد، یک سیستم یادگیری عمیق این کار را بدون مداخله انسان و به کمک مغز محاسباتی خود فرا میگیرد. شبیه به یک انسان که با دریافت اطلاعات، در مورد آنها فکر کرده و نتیجهگیری مینماید. سیستمهای یادگیری عمیق برای تحقق این امر از الگوریتمهایی با ساختار چندلایه یا به اصطلاح شبکههای عصبی مصنوعی بهره میگیرند.
یک نمونه مشهور و موفق از سیستمهای مبتنی بر یادگیری عمیق، پروژه AlphaGo شرکت گوگل است. برنامهای کامپیوتری که توانسته است بازی Go را فراگرفته و در سطح حرفهای به رقابت با انسانها بپردازد. Go یک بازی استراتژیک است که با تخته و مهره انجام شده، نیازمند ذهنی قدرتمند است و مسابقات حرفهای آن در سطح بینالمللی برگزار میشود. AlphaGo اولین برنامه کامپیوتری بود که موفق شد بر یک بازیکن واقعی و حرفهای Go غلبه نموده و حتی در سال 2016 قهرمان جهانی این بازی را با نتیجه 4 به 1 شکست دهد. اتفاقی که سر و صدای زیادی به پا نموده و به شکل ترسناکی نشان داد که یک ماشین میتواند با بهرهگیری از یادگیری عمیق یک بازی پیچیده را فراگرفته و بهترین نمایندگان انسانها را در آن بازی شکست دهد.
دلایل و مزایای استفاده از یادگیری ماشین در اپلیکیشنهای همراه
امروزه یکی از مهمترین انتظارات کاربران و کسبوکارها در زمینه اپلیکیشنهای همراه، شخصیسازی هوشمندانه و انطباق محتوا بر اساس سلیقه و نیاز کاربران است. هوش مصنوعی و یادگیری ماشین مهمترین ابزارها برای تحقق این انتظارات هستند. گزارشهای موسسات تحقیقاتی همچون Venture Scanner از میزان و چگونگی توزیع سرمایهگذاری شرکتها در زمینه کاربرد شاخههای مختلف هوش مصنوعی حاکی از آن است که یادگیری ماشین در کانون توجه اغلب این شرکتها قرار دارد. طبق گزارش این موسسه پروژهها و استارتآپهای مربوط به کاربردهای یادگیری ماشین در برهه زمانی جولای 2017 موفق به جذب بیش از 8 میلیارد دلار سرمایه از طریق 550 شرکت مختلف گردیده و از این جهت رتبه اول را در میان کاربردهای مختلف هوش مصنوعی کسب نمودهاند.
بخش قابل توجهی از این کاربردها و پروژهها به صورت مستقیم یا غیر مستقیم به استفاده از یادگیری ماشین در اپلیکیشنهای همراه مرتبط هستند. دلیل این مساله مزایای متعددیست که این تکنولوژی میتواند برای اپلیکیشنها به ارمغان آورد. برخی از مهمترین این مزایا عبارتند از:
• ارائه محتوا یا محصول مرتبط و متناسب
• تعامل و ارتباط شخصیسازی شده با کاربران
• تبلیغات متناسب و هدفمند
• جستوجوی سریع و راحت
• خلق تجربه کاربری جذاب و درگیرانه
• پیشبینی و تحلیل گرایشهای عمومی کاربران
• پیشگیری و تشخیص کلاهبرداری یا فعالیتهای مخرب
استفاده از یادگیری ماشین در اپلیکیشنهای فروش آنلاین
توسعهدهندگان انواع اپلیکیشنهای فروش آنلاین میتوانند با بهرهگیری از این تکنولوژی محتوای ارائه شده به کاربران را شخصیسازی نموده و تجربه کاربری به مراتب بهتری را برای آنها رقم زنند. الگوریتمهای یادگیری ماشین قادر هستند از طریق تحلیل محتوای اپلیکیشن، رفتار مشتری و الگوهای خرید، با هر بار استفاده کاربر از اپلیکیشن، پیشنهادهایی بهتر و متناسبتر با سلایق و نیازهای او ارائه نمایند. به علاوه، اپلیکیشنها به کمک یادگیری ماشین قادر به درک بهتر جستوجوهای متنی کاربران و در نتیجه ارائه نتایج بیشتر و مرتبطتری در پاسخ به آنها خواهند بود. امروزه بسیاری از اپلیکیشنهای موفق فروش آنلاین از این تکنولوژی برای فراهم آوردن امکان جستوجوی بهتر محصولات بهره میگیرند. از سوی دیگر، اپلیکیشنهای فروش آنلاین با توجه به تراکنشهای مالی بالایی که از طریق آن ها انجام میگیرد، به طور معمول در معرض اقدامات خلافکارانه و مخرب قرار دارند. یادگیری ماشین میتواند امکان نظارت بر فرآیندهای جاری اپلیکیشن را فراهم آورده، فعالیتهای مشکوک و مخرب را بدون نیاز به مداخله نیروی انسانی شناسایی و متوقف نماید.
از جمله کسبوکارهای بزرگی که در اپلیکیشنهای همراهِ خود، به شکلی کارآمد و تاثیرگذار از یادگیری ماشین استفاده میکنند میتوان به Starbucks ،eBay ،Amazon و Taco Bell اشاره نمود. اپلیکیشنهای فروشگاهی Amazon و eBay به کمک این تکنولوژی و بر اساس جستوجوها، علاقهمندیها و الگوی خرید کاربران، محصولات مختلفی را به آنها پیشنهاد داده و نتایج جستوجوهای کاربر را شخصیسازی مینمایند. اپلیکیشن MyStarbucks Barista به کمک یادگیری ماشین به کاربر کمک میکند تا قهوهای مطابق با ذائقه خود را به سریعترین شکل ممکن سفارش داده و آن را بدون نیاز به معطل شدن در صف، از فروشگاهی در مسیر خود دریافت نماید.
کاربرد یادگیری ماشین در اپلیکیشنهای ورزش و سلامت
یادگیری ماشین اپلیکیشنهای کنترل سلامت را قادر میسازد تا اطلاعات مربوط به فعالیتهای روزانه کاربران از جمله ورزش، پیادهروی، خواب و نوشیدن آب را به خوبی جمعآوری کرده، با تحلیل اطلاعات مربوط به هزاران کاربر و در نظر گرفتن شرایط جسمانی هر یک از آنها، هشدارهای لازم جهت افزایش فعالیت، مصرف آب بیشتر یا کمبود خواب را به ایشان ارائه نماید. چنانچه کاربری مبتلا به دیابت باشد، یک اپلیکیشن سلامت به کمک یادگیری ماشین قادر خواهد بود با دریافت و بررسی نتایج آزمایشها و شرایط جسمانی کاربر، تحلیل و مقایسه آن با اطلاعات سایر کاربران مبتلا به دیابت، فعالیتهای روزانه کاربر را با هدف کنترل قند خون وی کنترل نموده و درمانهای متناسب را در شرایط مختلف پیشنهاد دهد. اپلیکیشنهای ورزش و تناسب اندام میتوانند با استفاده از یادگیری ماشین تمرینهای ورزشی و رژیم غذایی هر کاربر را بر اساس شرایط، اهداف و نیازهای او بهینهسازی نموده و به این ترتیب به یک مربی شخصی تمام وقت برای کاربران بدل شوند. به عنوان نمونه اپلیکیشن Optimize – Fitness Trainer به همین ترتیب نقش یک مربی بدنسازی را برای کاربران خود ایفا نموده و سعی میکند با ارائه تمرینهای شخصیسازی شده و متناسب با محیط منزل، محل کار یا باشگاه بدنسازی، بدنی سالمتر و اندامی زیباتر را برای آنها به ارمغان آورد. این اپلیکیشن با بهرهگیری از یادگیری عمیق و بر اساس اطلاعاتی همچون شرایط فیزیکی کاربر، اطلاعات ژنتیکی وی، تجهیزات موجود، سابقه تمرینها، روند کاهش یا افزایش وزن و وقت آزاد کاربر، سعی مینماید نوع تمرینها، وزنههای انتخابی (در صورت امکان استفاده از تجهیزات)، تعداد دفعات تکرار و زمان انجام تمرینهای ورزشی را به متناسبترین شکل ممکن برای کاربر برنامهریزی نماید.
ارتقای کیفیت تصاویر دوربین تلفنهای همراه به کمک یادگیری عمیق
گروهی از دانشمندان سوییسی با ساخت یک شبکه عصبی در تلاش برای توسعه سیستمی هستند که با دریافت تصاویر کمکیفیت گرفته شده توسط دوربین گوشیهای هوشمند، کیفیت آنها را به میزان قابل توجهی ارتقا بخشیده و به سطح تصاویر دوربینهای حرفهای DSLR نزدیک نمایند. این دانشمندان در مقالهای که در همین ارتباط منتشر شده است بیان داشتهاند: "دوربینهای فشرده و پایین-رده به دلیل محدودیتهایی در خصوص بودجه، سختافزار و اندازه، ضعفهایی را در کیفیت تصویر به نمایش میگذارند. ما راهکاری مبتنی بر یادگیری عمیق را پیشنهاد میدهیم که به صورت خودکار تصاویر گرفته شده توسط دوربینهایی با تواناییهای محدود را به تصاویری با کیفیت DSLR بدل میسازد."
این گروه پس از طراحی و ساخت این سیستم یادگیری عمیق، عکسهایی را از سوژهها و مناظر یکسان با استفاده از تعدادی گوشیهای هوشمند نسبتا قدیمی (از جمله BlackBerry Passport ،iPhone 3GS و Sony Xperia Z) و همچنین یک دوربین DSLR (کانن 70D) ثبت نموده، به کمک آنها تفاوت میان عکسهای کیفیت پایین با عکسهای DSLR را به این سیستم آموزش دادند. آنها سپس کار آموزش سیستم را با مجموعهای بزرگ از عکسهای گرفته شده توسط همین دوربینها اما با سوژههای تصویری کاملا متفاوت میان دوربین DSLR و دوربین گوشیهای هوشمند ادامه دادند. اکنون این سیستم با تکیه بر الگوریتمهای یادگیری عمیق و با استفاده از آموزشهایی که دریافت نموده است میتواند با دریافت تصاویر گرفته شده توسط دوربین تلفنهای همراه، کیفیت آنها را به سطح کیفی DSLR ارتقا بخشد.
در پروژهای دیگر محققین شرکت گوگل و دانشگاه MIT در حال توسعه یک سیستم مبتنی بر یادگیری عمیق هستند که قادر است در قالب یک اپلیکیشن مستقل، کیفیت تصاویر دریافتی از دوربین گوشیهای هوشمند را به صورت زنده و همزمان (real-time) بهبود بخشد. در واقع این اپلیکیشن قادر است تا عکس را حتی قبل از اینکه ثبت شود، در سطح یک عکاس حرفهای روتوش نماید. این تیم تحقیقاتی پس از توسعه الگوریتمهای مورد نظر خود و خلق شبکه عصبی مربوطه، با همکاری شرکت Adobe Systems اقدام به جمعآوری مجموعهای نسبتا بزرگ از تصاویر برای آموزش نحوه ارتقا و روتوش تصویر به این سیستم نمودند. مجموعهای متشکل از 5 هزار تصویر مختلف که هر یک توسط 5 عکاس حرفهای مورد روتوش و اصلاح رنگ قرار گرفته، این سیستم مبتنی بر یادگیری عمیق را قادر به فراگیری این مساله ساخته است که چگونه و با اعمال چه تغییراتی میتوان تصویر اولیه دریافتی را به تصویر مطلوب و بهبود یافته تبدیل نمود.
استفاده از یادگیری ماشین برای بهبود کیفیت تصاویر اتفاق جدیدی نبوده و در گذشته بارها با موفقیت انجام گرفته است. پیشرفت بهدست آمده در جریان این پروژه اخیر که آن را از نمونههای مشابه متمایز نموده است، کوچک نمودن و بهینهسازی الگوریتمها در حدیست که این سیستم میتواند به صورت مستقل و بدون نیاز به سرورهای ابری، روی یک گوشی هوشمند معمولی تصاویر دریافتی از دوربین را به صورت زنده و بدون وقفه روتوش نماید. چنانچه علاقمند به کسب اطلاعات بیشتر در مورد این پروژه هستید، شما را به مشاهده ویدئوی معرفی این سیستم -- که توسط تیم توسعهدهنده آن منتشر شده است -- دعوت میکنیم.
هنوز خبر دقیقی از زمان عرضه عمومی این اپلیکیشن منتشر نشده است. همچنین مشخص نیست که آیا این سیستم در قالب یک اپلیکیشن جدید و مستقل عرضه خواهد شد، یا جهت ارتقای اپلیکیشن دوربین گوگل در دل گوشیهای هوشمند پیکسل به کار خواهد رفت. شاید هم در حالت ایدهآل گواهی استفاده از این تکنولوژی با قیمتی مشخص در اختیار توسعهدهندگان اپلیکیشنهای دوربین و تولیدکنندگان گوشیهای هوشمند قرار داده شود.
خدمات و ابزارهای گوگل در زمینه یادگیری ماشین
گوگل در سالهای اخیر با سرمایهگذاری و تمرکز بالا در این زمینه، نام خود را به عنوان شرکتی پیشگام و تاثیرگذار در زمینه هوش مصنوعی و یادگیری ماشین مطرح نموده است. این شرکت علاوه بر بهکارگیری یادگیری ماشین در بسیاری اپلیکیشنها، سرویسها و محصولات خود، سیستمهای هوش مصنوعی پیشرفتهای همچون AlphaGo Zero و Google Assistant را با تکیه بر الگوریتمهای یادگیری عمیق توسعه داده، همچنین با ارائه کتابخانه نرمافزاری متن-باز TensorFlow و حتی طراحی تراشههای خاص منظورهای با نام TPU (مخفف Tensor Processing Unit) با قابلیت پردازش بهینه و موثر APIهای این کتابخانه، راه دیگر شرکتها و برنامهنویسان مستقل را برای توسعه سیستمهای مبتنی بر یادگیری ماشین هموار نموده است.
امروزه اغلب اپلیکیشنها و سرویسهای آنلاین گوگل به نوعی از یادگیری ماشین برای ارائه خدمات بهتر، متناسبتر و شخصیسازی شدهتر به کاربران بهره میگیرند. Google Translate قادر است با استفاده از این تکنولوژی تشخیص دهد که آیا یک عکس حاوی متن هست یا خیر، موقعیت آن را شناسایی نموده و با تشخیص زبان مربوطه، آن را به زبان مورد نظر کاربر ترجمه نماید. Google Music بر اساس سابقه خرید و پخش موسیقی کاربر، سلیقه موسیقیایی وی را تشخیص داده و آهنگهایی متناسب را به او پیشنهاد میدهد. موتور جستوجوی گوگل بر اساس سابقه جستوجوها و نتایج انتخابهای کاربران، عبارتهای جستوجوی مناسب را به آنها پیشنهاد داده و در قسمت جستوجوی تصاویر، عکسها را بر اساس محتملترین نیازهای کاربر در گروههایی دستهبندی نموده و به او ارائه مینماید. YouTube از یادگیری ماشین برای شناسایی موضوعات مورد علاقه کاربر استفاده نموده، بر آن اساس ویدئوهای ارائه شده توسط کانالهایی که کاربر در آنها عضویت دارد را مرتبسازی مینماید و همچنین ویدئوهای جدیدی متناسب با سلایق کاربر به وی پیشنهاد میدهد. اپلیکیشن Inbox قادر است ایمیلهای دریافتی کاربر را بر اساس نیازها، علایق و ارتباطات او با دیگران مرتب و بهینه کند و حتی بر اساس نحوه پاسخگویی کاربر در گذشته، پاسخهای هوشمندانهای را برای ایمیلهای دریافتی تنظیم نماید.
در سالهای اخیر شرکت گوگل دو سیستم هوش مصنوعی خود با نامهای AlphaGo و Google Assistant را با تکیه بر تکنولوژی شبکههای عصبی مصنوعی و یادگیری عمیق توسعه و آموزش داده است. هوش مصنوعی AlphaGo پس از فراگیری بازی استراتژیک Go، در سالهای 2015 و 2016 موفق گردید بازیکنان حرفهای آن را در عرصه بینالمللی شکست دهد. به دنبال این موفقیت گوگل نسخه جدید و پیشرفتهتر این هوش مصنوعی را با نام AlphaGo Zero در سال 2017 معرفی نمود. این هوش مصنوعی که با استفاده از بستر برنامهنویسی TensorFlow گوگل توسعه یافته است، به سرعت بازی Go را فرا گرفته و موفق شد با شکست دو نفر از بهترین بازیکنان جهان، به صورت ضمنی عنوان برترین بازیکن Go را به خود اختصاص دهد.
از سوی دیگر با معرفی و عرضه Google Assistant در سال 2017، گوگل سعی نمود هوش مصنوعی و یادگیری عمیق را به صورت مستقیم و در قالب یک دستیار شخصی هوشمند وارد زندگی شخصی کاربران خود نموده و به خدمت ایشان درآورد. این هوش مصنوعی به عنوان مثال در حال حاضر قادر است قرارهای کاربر را به وی یادآوری نماید، فاصله زمانی تا محل کار او را با پیشبینی ترافیک تخمین بزند، آهنگهای مورد علاقه کاربر را دانلود و پخش کند، دوستان او را در عکسها شناسایی نموده و در صورت تمایل کاربر آن عکسها را با ایشان به اشتراک بگذارد. البته با توجه به پتانسیل بالای این هوش مصنوعی و اکوسیستم گسترده گوگل، میتوان اطمینان داشت که دامنه توانمندیهای Google Assistant به همین میزان محدود نگردیده، با گذشت زمان سطح هوشمندی و مجموعه قابلیتهای آن به سرعت افزایش خواهد یافت.
شرکت گوگل در سال 2015 بستر برنامهنویسی و کتابخانه نرمافزاری ویژه خود برای یادگیری ماشین و یادگیری عمیق با نام TensorFlow را به صورت متنباز در اختیار عموم قرار داد تا بدین وسیله دیگر توسعهدهندگان را در خلق سیستمهای مبتنی بر شبکههای عصبی یاری دهد. البته گوگل در مسیر ارائه خدمات یادگیری ماشین برای توسعهدهندگان به همینجا بسنده ننموده است. این شرکت با آمادهسازی تعدادی مدل یادگیری ماشین به صورت از-پیش-آموزش-یافته و در قالب APIهای تجاری، این امکان را برای توسعهدهندگان اپلیکیشنهای همراه فراهم آورده تا بدون درگیر شدن در فرآیند توسعه شبکههای عصبی و سیستمهای یادگیری ماشین، به راحتی و تنها با فراخوانی APIهای مربوطه در اپلیکیشنهای خود سیستمهای پیشرفته یادگیری عمیق گوگل را به خدمت گیرند. استفاده از این APIهای یادگیری ماشین که از طریق بستر خدمات ابری گوگل سرویسدهی میشوند در سطوح پایین رایگان بوده و در مقیاس تجاری با هزینههایی اندک همراه است. مهمترین و پرکاربردترین APIهای یادگیری ماشین گوگل که به صورت خدمات ابری ارائه میشوند عبارتند از: تحلیل تصویر؛ ترجمه ابری؛ تبدیل صدا به متن؛ تحلیل متن؛ تحلیل ویدئو و حتی شغلیابی.
تشخیص و تحلیل عناصر تصویر با استفاده از سرویس دید ابری گوگل
توسعهدهندگان میتوانند با استفاده از API دید ابری یا Cloud Vision گوگل در دل اپلیکیشن خود، قابلیت شناسایی و درک محتوای یک عکس را به دست آورند. از جمله مهمترین قابلیتهای این API میتوان به موارد زیر اشاره نمود:
• تشخیص عناصر تصویر: امکان شناسایی عناصر مختلف موجود در تصویر، توصیف و دستهبندی آنها.
• تشخیص چهره: امکان شناسایی چهرههای متعدد درون یک عکس به همراه خصوصیات کلیدی هر چهره از جمله وضعیت احساسی، پوشش سر و صورت، رنگ پوست و نوع مو.
• تشخیص نوری حروف: قابلیت شناسایی و استخراج متن از درون عکس با پشتیبانی از زبانهای متعدد و امکان تشخیص خودکار زبان متن.
• تشخیص لوگو: امکان شناسایی لوگوی برندهای معروف و شناخته شده درون تصاویر.
• تشخیص منظره: قابلیت تشخیص مناظر طبیعی و بناهای ساخت دست بشر در تصاویر.
• تشخیص محتوای نامناسب: امکان شناسایی انواع محتوای نامناسب از جمله عناصر خشونتآمیز یا مبتذل درون عکسها.
به عنوان مثال Realtor.com به عنوان یک مجموعه فعال در زمینه معاملات املاک، از این API گوگل در توسعه اپلیکیشن خود برای سیستمعاملهای اندروید و iOS بهره گرفته است. هنگامی که کاربران این اپلیکیشن در زمان جستوجو برای خرید یک ملک با اجرای اپلیکیشن از آن ملک، تابلو یا آگهی فروش آن عکس بگیرند، این اپلیکیشن با بهرهگیری از قابلیتهای دید ابری گوگل عناصر موجود در تصویر را شناسایی نموده، اطلاعات مربوط به مشخصات ملک و شرایط خرید آن را به کاربر ارائه میکند.
تحلیل، تبدیل و ترجمه متن به کمک APIهای ابری یادگیری ماشین گوگل
شرکت گوگل چند سرویس متکی بر یادگیری ماشین را در قالب APIهایی برای کار با متن ارائه مینماید که از مهمترین آنها میتوان به گوگل Cloud Speech، گوگل Cloud Natural Language و گوگل Cloud Translation اشاره نمود.
سرویس Cloud Speech با بهرهگیری از مدلهای قدرتمند شبکه عصبی امکان تبدیل صدا به متن را به راحتی از طریق فراخوانی API مربوطه برای توسعهدهندگان اپلیکیشنها فراهم میآورد. این API در حال حاضر قادر به تشخیص 110 زبان مختلف بوده و حتی میتواند در صورت تمایلِ توسعهدهنده به صورت خودکار محتوای نامناسب را در متنی که تولید میشود فیلتر نماید. این سرویس میتواند با دریافت یک فایل صوتی، زبان آن را تشخیص داده و محتوایش به متن تبدیل نماید. همچنین قادر است صدای کاربر را حتی در محیطهای شلوغ و دارای نویز به صورت زنده و همزمان به متن تبدیل کند.
Cloud Natural Language دیگر API مهم گوگل برای پردازش متن است که میتواند با تحلیل متن موجود در یک فایل، مقاله خبری یا صفحه وب، اطلاعات مختلفی را در مورد اشخاص، مکانها، رویدادها و بسیاری عناصر دیگر از آن استخراج نماید. این سرویس امکان تشخیص زبان متن را دارا بوده و حتی قادر است احساس کلی نویسنده را در خصوص موضوع مورد اشاره در متن شناسایی و درک نماید. این قابلیت مهم میتواند ابزاری قدرتمند و کارآمد در دست فروشگاههای آنلاین باشد برای تحلیل خودکار نظرهای کاربران و استفاده از نتایج به دست آمده برای اصلاح ایرادات، جلب نظر مشتری و افزایش فروش به صورت کاملا خودکار و کم هزینه. به علاوه، ترکیب این API با سرویسهای Cloud Vision و Cloud Speech امکان استخراج و تحلیل این نوع اطلاعات متنی را از صدا و تصویر نیز میسر مینماید.
Cloud Translation همانطور که از نامش پیداست، به کمک یادگیری ماشین امکان ترجمه هوشمندانه متن را از زبانی به زبان دیگر فراهم میآورد. سرویس ترجمه ابری گوگل بیش از 100 زبان مختلف را پشتیبانی نموده و میتواند زبان متن را بلافاصله با دقتی بالا شناسایی نماید. این API هم قادر خواهد بود در ترکیب با سرویسهای Cloud Vision و Cloud Speech، ترجمه محتوای موجود در صدا و تصویر را نیز میسر کند.
- نگاه ویدئویی به پنج ویژگی مشترک در نسل جدید گوشیهای پرچمدار
- معرفی Redmi A4 5G – پایینرده 100 دلاری با نمایشگر 6.88 اینچی، SD 4s Gen 2 و باتری 5,160mAh
- معرفی ZTE Blade V70 – میانردهای با السیدی +HD و دوربین 108 مگاپیکسلی
- معرفی خانواده ROG Phone 9 – گیمینگ فونهای ایسوس با اسنپدراگون 8 الیت و نمایشگر 185 هرتزی
- نگاهی به HyperOS 2 به همراه جدول زمانی و فهرست دیوایسهای قابل ارتقاء به این پوسته
- نگاهی به فناوری ISOCELL ALoP – راهکار سامسونگ برای کاهش برآمدگی دوربینهای بخش پشتی گوشی
- شیائومی 14T Pro در نگاه رسانهها – نقاط ضعف و قوت از دید حرفهایها