مقایسه میان سه دستیار صوتی هوشمند Google now، Siri و Cortana در پاسخدهی به سؤالات مبتنی بر دانش
نمایش خبر
تاریخ : 1393/7/29 نویسنده: مریم رشنو | ||
برچسبها : | دستیار شخصی هوشمند Intelligent Personal Assistant ، سیری Siri ، Google Now ، کورتانا Cortana ، گوگل Google ، اپل Apple ، مایکروسافت Microsoft |
واحد خبر mobile.ir : موسسه مشاوره استون تمپل (Stone Temple Consulting) نتایج تازهترین پژوهش خود را در خصوص دستیارهای صوتی هوشمند منتشر کرد.
بسته به نوع گوشی که از آن استفاده میکنید ممکن است از دستیار صوتی هوشمند خاصی بهره ببرید. یکی از کارکردهای اصلی این اپلیکیشنها آن است که تا حد امکان با سرعت به پرسشهای کاربر پاسخهای مفید دهند. اما کدام یک از این برنامهها عملکرد بهتری دارد؟ به تازگی موسسه مشاوره استون تمپل نتایج پژوهش خود را در این باره در تاریخ 7 اکتبر 2014 ( 15 مهر) منتشر کرده است. در این پژوهش سه دستیار صوتی هوشمند مشهور یعنی Google Now، Siri و Cortana برای انجام مقایسه برگزیده شدند. این مؤسسه برای سنجش کارایی سه اپلیکیشن فوق و مقایسه احتمال انجام صحیح درخواست کاربر 3086 پرسش واقعی و متفاوت را در برابر آنها قرار داد تا مشخص شود کدام یک بهترین عملکرد را از خود نشان میدهد. مطابق نتایج این بررسی دستیار هوشمند Google Now با اختلاف قابل توجهی نسبت به سایرین کارایی بهتری از خود نشان داد.
از جهت سختافزاری، Cortana روی گوشی نوکیا لومیا 635 با سیستم عامل ویندوزفون، Siri روی گوشیهای آیفون 4 اس و آیفون 5 و گوگل اپ (که برنامه Google Now جزئی از آن به شمار میرود) نیز روی آیفون 4 اس و آیفون 5 اجرا شد. در این طرح، اندازهگیری اینکه هر یک از این برنامهها از چه تعداد منبع داده استفاده میکنند، میزان دقت نتایج حاصل از جستجو و شناسایی تمام موارد تشخیص اشتباه مد نظر قرار گرفت. البته در این مسیر مقایسه ویژگیهای متفاوت این اپلیکیشنها مورد توجه نبوده بلکه این برنامهها باتوجه به میزان دانش موجود در هنگام پرسش قیاس شدهاند. به جهت دشواری امتیازدهی، انتخاب پرسشها به گونهای بوده است که یک پانل دانش (knowledge panel) شکل گیرد و از این جهت پرسشهای طرحشده به هیچ عنوان تصادفی نبودهاند. منظور از پانل دانش یا جعبه دانش (knowledge box) محتوایی است که پس از جستجوی یک عنوان به جستجوکننده ارائه میشود و حاوی پاسخ مستقیم به سؤال مطرح شده است.
تصویر بالا: نمونهای از یک جعبه دانش (Knowldge-Box)
مطابق اعلام موسسه، منابع مورد استفاده در این آزمون بر اساس گوگل و بینگ طراحی شده است و این امر به دلیل ویژگیهای متفاوت این دو موتور جستجو است. در واقع گوگل نه تنها از منابع زیادی برای استخراج داده استفاده میکند بلکه روشهای مختلفی برای نمایش نتایج دارد. به طور مثال اگر از Google Now بپرسید ارتفاع برج ایفل چقدر است، علاوه بر پاسخ به این پرسش اسامی دیگر برجهای بلند نیز به شما گفته خواهد شد (گوگل از اطلاعات زیادی برای گراف دانش استفاده میکند). این در حالی است که نتایج Siri در پاسخ به پرسش فوق بر پایه جستجویی سریع در ویکی پدیا یا ولفرام آلفا است که برج خلیفه یا امپایر استیت بیلدینگ را در نظر نمیگیرد. علاوه بر این، از دید مؤسسه STC نتایج اپل معمولا ضعیف است؛ گاهی اوقات پاسخ طنز به شما داده میشود و برخی اوقات پاسخ جدی. از سوی دیگر، با آن که Cortana از منابع مختلفی برای جستجو بهره میگیرد اما همیشه پاسخ صحیح را نشان نمیدهد. مثلا اگر بپرسید که قدمت تونل لینکلن در نیویورک چقدر است، در پاسخ اطلاعاتی راجع به آبراهام لینکلن -- شانزدهمین رئیس جمهور آمریکا -- دریافت خواهید کرد.
تصویر بالا (از چپ به راست): پاسخهای Cortana ،Siri و Google Now به پرسش «بلندترین کوه جهان کدام کوه است؟»
بر اساس گفتههای اریک انگ (Eric Enge) از موسسه STC، تمام پرسشهای این آزمون حتی در زمان استفاده از موتور جستجوی گوگل و بینگ نیز براساس فرامین صوتی انجام شده است. پس از جمعآوری نتایج حاصل از پاسخهای این سه دستیار مجازی هوشمند، پاسخ های Google Now با 88% پاسخ کامل از دیگر برنامهها پیشی گرفته است. این دستیار دیجیتال به 88٪ پرسشها پاسخ کامل داده است، در صورتی که Siri با 53٪ و Cortana با40٪ پاسخ کامل، عملکرد ضعیفتری را نشان دادهاند. در واقع آمار فوق نشاندهنده میزان گستردگی و کامل بودن اطلاعات ارائهشده به هر پرسش است که به صورت مجموع در نظر گرفته شده است. از این رو محققان STC نتیجه گرفتهاند که توانایی گوگل برای نشان دادن اطلاعات -- از جمله جزئیات و لینکهای تکمیلی درباره موضوعات مشابه -- بیشتر است.
البته نکته قابل توجه در خصوص نتایج این پژوهش آن است که نمیتوان چنین نتایجی را به طور کامل به توانایی هر یک از دستیاران هوشمند -- به ویژه در زمینه انجام وظیفه دستیاری -- منتسب کرد. در واقع در کنار درک صحیح فرمان صوتی مخاطب که سنجش آن احتمالا به روشهای دیگری نیاز خواهد داشت، کیفیت و تنوع پاسخهای ارائه شده تا حدود زیادی به نحوه طراحی سؤالات و ارتباط این سؤالات با بانک اطلاعاتی مورد استفاده مرتبط است. از این رو این پژوهش بیش از آنکه توانایی هر یک از سه دستیار مورد اشاره را نشان دهد، بازتابی از ذهنیت طراحان سؤال و کیفیت اطلاعات موجود در بانکهای اطلاعاتی و موتورهای جستجوی مرتبط با هر یک از سؤالات است. لذا احتمال بسیاری وجود دارد که در پژوهشی دیگر، که از زاویهای متفاوت و بر مبنایی دیگر به طراحی سؤالات پرداخته باشد، نتایجی کاملا متفاوت به دنیای دیجیتال ارائه شود.
- Honor 300 Ultra با SD 8 Gen 3، باتری سیلیکون|کربن 5,300mAh، شارژر بیسیم 80 واتی و حسگر اولتراسونیک
- معرفی iQOO Neo10 و iQOO Neo10 Pro – پرچمدارهایی با باتری 6,100mAh و نمایشگر 8T LTPO AMOLED
- معرفی ویوو S20 و S20 Pro با باتری 6,500mAh در نسخه استاندارد و سه دوربین 50MP در مدل Pro
- معرفی REDMI K80 Pro با پردازنده SD 8 Elite، حسگر اثر انگشت اولتراسونیک و باتری 6,000mAh
- معرفی REDMI K80 با پردازنده SD 8 Gen 3، باتری سیلیکون|کربن 6,550mAh و اثر انگشت اولتراسونیک
- معرفی هواوی +Mate 70 Pro و Mate 70 RS با شاسی تیتانیوم، باتری 5,700mAh و UWB در نسخه RS
- معرفی هواوی Mate 70 و Mate 70 Pro با دوربین اولتراواید 40MP و انتقال حسگر اثر انگشت به دکمه پاور!