درخواست پتنت اپل برای تشخیص کلمات با استفاده از حسگرهای حرکتی – آیا Siri لبخوانی خواهد کرد؟
نمایش خبر
تاریخ : 1402/5/19 نویسنده: مسعود بهرامی شرق | ||
برچسبها : | حق اختراع Patent ، مالکیت معنوی Intellectual Property ، اداره ثبت اختراعات و علائم تجاری آمریکا USPTO ، اپل Apple |
شاید دیوایسهای اپل در آینده با استفاده از تشخیص حرکت اقدام به لبخوانی کرده و به این ترتیب موجب فعال شدن Siri (بدون نیاز به میکروفن) شوند. اگر سن شما به اندازه کافی زیاد باشد، ممکن است با شنیدن این مطلب، یاد فیلم «2001: ادیسه فضایی» ساخته استنلی کوبریک بیفتید؛ فیلمی که در آن یک کامپیوتر به نام HAL 9000 توانایی خارقالعادهای در تشخیص صدا داشت؛ همان چیزی که Siri هنوز نتوانسته آن را صد در صد و بی عیب و نقص به سرانجام برساند. از این رو، چنانچه یک جنبه دیگر مثل توانایی تشخیص حرکات دهان و سر به Siri اضافه شود، میتواند میزان دقت این دستیار صوتی را بالاتر ببرد.
این دقیقا همان چیزیست که در متن درخواست پتنت جدید اپل به آن اشاره شده است. عنوان این درخواست پتنت Keyword Detection Using Motion Sensing (تشخیص کلمه کلیدی با استفاده از حس کردن حرکت) بوده و سازوکار مورد نظر اپل را این گونه توصیف میکند: « [داده] از یک سنسور حرکتی دریافت میشود، به عنوان مثال، ثبت حرکت یک کاربر در هنگامی که او یک ورودی گفتاری را به زبان میآورد.» پس از آن باید تعیین شود که آیا بخشی از این داده حرکتی با داده مرجع برای مجموعهای از یک یا چند کلمه مطابقت دارد یا خیر. در صورت تطابق، Siri فرمان صوتی را اجرا خواهد کرد.
به گفته اپل، سیستمهای کنترلی که صرفا به صدای شخص واکنش نشان میدهند، ممکن است دچار خطا شوند (شبیه مثالی که در مقدمه ذکر شد). این خطا ممکن است به دلیل اختلال ناشی از نویزهای محیطی و یا صدای ناخواسته یک کاربر دیگر اتفاق بیفتد. حال در این سناریوی جدید، اگر Siri توانایی لبخوانی داشته باشد، چنین خطاهایی رخ نخواهد داد.
این طرح جدید علاوه بر افزایش دقت Siri، یک فایده دیگر هم دارد و آن کاهش مصرف انرژی است. در حال حاضر، راهاندازی یک دستیار صوتی مثل Siri مستلزم آن است که میکروفنها همواره فعال و آماده دریافت فرمان صوتی باشند (حتی زمانی که هیچ داده صوتی دریافت نشود). همین امر موجب مصرف انرژی و منابع پردازشی خواهد شد. اما اگر Siri به قابلیت لبخوانی مجهز شود، دیگر نیازی به آمادهباش بودن میکروفنها نبوده و این میتواند در نهایت به کاهش مصرف باتری ختم شود.
نکته جالب دیگری نیز در درخواست پتنت اپل ذکر شده که شاید از دید اکثر افراد مغفول بماند: زمانی که شخصی در حال صحبت کردن است، دهان، سر، صورت و گردن او حرکات و ارتعاشاتی را ایجاد میکنند. حسگرهای حرکتی مثل شتابسنج و ژیروسکوپ میتوانند این حرکات را تشخیص دهند. این حسگرهای حرکتی برخلاف سنسورهای صوتی (مثل میکروفن) انرژی کمتری مصرف میکنند و این باز هم گام دیگری در جهت کاهش مصرف و افزایش عمر باتری خواهد بود.
یک نکته مهم را نباید فراموش کنیم. زمانی که کاربر عبارات ساده (مثل Siri) یا فرمانهای متداول (مثل Next track) را به کار میبرد، تشخیص حرکت و لبخوانی برای Siri چندان دشوار نیست. اما وقتی فرمان صوتی کمی از فرمانهای متداول فاصله میگیرد، بعید است قابلیت تشخیص حرکت بتواند به درستی کار کند. اما حداقل فایده این قابلیت در آنجاست که به محض تشخیص عبارات ساده (مثل Hey Siri)، میکروفن دستگاه فعال شده و آماده شنیدن ادامه فرمان صوتی کاربر خواهد بود.
در پایان لازم به ذکر است، اپل مشخص نکرده که کدام دیوایسهای این شرکت میتوانند از قابلیت لبخوانی بهرهمند شوند، اما یکی از بهترین گزینهها برای استفاده از این قابلیت، هدست Apple Vision Pro خواهد بود.
- معرفی Redmi A4 5G – پایینرده 100 دلاری با نمایشگر 6.88 اینچی، SD 4s Gen 2 و باتری 5,160mAh
- معرفی ZTE Blade V70 – میانردهای با السیدی +HD و دوربین 108 مگاپیکسلی
- معرفی خانواده ROG Phone 9 – گیمینگ فونهای ایسوس با اسنپدراگون 8 الیت و نمایشگر 185 هرتزی
- نگاهی به HyperOS 2 به همراه جدول زمانی و فهرست دیوایسهای قابل ارتقاء به این پوسته
- نگاهی به فناوری ISOCELL ALoP – راهکار سامسونگ برای کاهش برآمدگی دوربینهای بخش پشتی گوشی
- شیائومی 14T Pro در نگاه رسانهها – نقاط ضعف و قوت از دید حرفهایها
- گزارش Canalys از بازار اسمارتفون خاور میانه در سهماهه سوم 2024 – رشد اندک در سایه تنشهای سیاسی