درخواست پتنت اپل برای تشخیص کلمات با استفاده از حسگرهای حرکتی – آیا Siri لبخوانی خواهد کرد؟
نمایش خبر
تاریخ : 1402/5/19 نویسنده: مسعود بهرامی شرق | ||
برچسبها : | حق اختراع Patent ، مالکیت معنوی Intellectual Property ، اداره ثبت اختراعات و علائم تجاری آمریکا USPTO ، اپل Apple |
شاید دیوایسهای اپل در آینده با استفاده از تشخیص حرکت اقدام به لبخوانی کرده و به این ترتیب موجب فعال شدن Siri (بدون نیاز به میکروفن) شوند. اگر سن شما به اندازه کافی زیاد باشد، ممکن است با شنیدن این مطلب، یاد فیلم «2001: ادیسه فضایی» ساخته استنلی کوبریک بیفتید؛ فیلمی که در آن یک کامپیوتر به نام HAL 9000 توانایی خارقالعادهای در تشخیص صدا داشت؛ همان چیزی که Siri هنوز نتوانسته آن را صد در صد و بی عیب و نقص به سرانجام برساند. از این رو، چنانچه یک جنبه دیگر مثل توانایی تشخیص حرکات دهان و سر به Siri اضافه شود، میتواند میزان دقت این دستیار صوتی را بالاتر ببرد.
این دقیقا همان چیزیست که در متن درخواست پتنت جدید اپل به آن اشاره شده است. عنوان این درخواست پتنت Keyword Detection Using Motion Sensing (تشخیص کلمه کلیدی با استفاده از حس کردن حرکت) بوده و سازوکار مورد نظر اپل را این گونه توصیف میکند: « [داده] از یک سنسور حرکتی دریافت میشود، به عنوان مثال، ثبت حرکت یک کاربر در هنگامی که او یک ورودی گفتاری را به زبان میآورد.» پس از آن باید تعیین شود که آیا بخشی از این داده حرکتی با داده مرجع برای مجموعهای از یک یا چند کلمه مطابقت دارد یا خیر. در صورت تطابق، Siri فرمان صوتی را اجرا خواهد کرد.
به گفته اپل، سیستمهای کنترلی که صرفا به صدای شخص واکنش نشان میدهند، ممکن است دچار خطا شوند (شبیه مثالی که در مقدمه ذکر شد). این خطا ممکن است به دلیل اختلال ناشی از نویزهای محیطی و یا صدای ناخواسته یک کاربر دیگر اتفاق بیفتد. حال در این سناریوی جدید، اگر Siri توانایی لبخوانی داشته باشد، چنین خطاهایی رخ نخواهد داد.
این طرح جدید علاوه بر افزایش دقت Siri، یک فایده دیگر هم دارد و آن کاهش مصرف انرژی است. در حال حاضر، راهاندازی یک دستیار صوتی مثل Siri مستلزم آن است که میکروفنها همواره فعال و آماده دریافت فرمان صوتی باشند (حتی زمانی که هیچ داده صوتی دریافت نشود). همین امر موجب مصرف انرژی و منابع پردازشی خواهد شد. اما اگر Siri به قابلیت لبخوانی مجهز شود، دیگر نیازی به آمادهباش بودن میکروفنها نبوده و این میتواند در نهایت به کاهش مصرف باتری ختم شود.
نکته جالب دیگری نیز در درخواست پتنت اپل ذکر شده که شاید از دید اکثر افراد مغفول بماند: زمانی که شخصی در حال صحبت کردن است، دهان، سر، صورت و گردن او حرکات و ارتعاشاتی را ایجاد میکنند. حسگرهای حرکتی مثل شتابسنج و ژیروسکوپ میتوانند این حرکات را تشخیص دهند. این حسگرهای حرکتی برخلاف سنسورهای صوتی (مثل میکروفن) انرژی کمتری مصرف میکنند و این باز هم گام دیگری در جهت کاهش مصرف و افزایش عمر باتری خواهد بود.
یک نکته مهم را نباید فراموش کنیم. زمانی که کاربر عبارات ساده (مثل Siri) یا فرمانهای متداول (مثل Next track) را به کار میبرد، تشخیص حرکت و لبخوانی برای Siri چندان دشوار نیست. اما وقتی فرمان صوتی کمی از فرمانهای متداول فاصله میگیرد، بعید است قابلیت تشخیص حرکت بتواند به درستی کار کند. اما حداقل فایده این قابلیت در آنجاست که به محض تشخیص عبارات ساده (مثل Hey Siri)، میکروفن دستگاه فعال شده و آماده شنیدن ادامه فرمان صوتی کاربر خواهد بود.
در پایان لازم به ذکر است، اپل مشخص نکرده که کدام دیوایسهای این شرکت میتوانند از قابلیت لبخوانی بهرهمند شوند، اما یکی از بهترین گزینهها برای استفاده از این قابلیت، هدست Apple Vision Pro خواهد بود.
- بررسی ویدئویی و نگاهی از نزدیک به ردمی +Note 14 Pro
- معرفی Moto G05 ،Moto G15 Power ،Moto G15 و Moto E15 – پایینردههای اقتصادی موتورولا
- رونمایی از Poco M7 Pro 5G – میانردهای با Dimensity 7025 Ultra و دوربین 50 مگاپیکسلی
- معرفی Honor GT با SD 8 Gen 3، دوربین اصلی 50 مگاپیکسلی و شارژر سیمی 100 واتی
- معرفی نسخه چینی vivo Y300 5G – میانردهای با تراشه Dimensity 6300 و اسپیکرهای قدرتمند
- معرفی Lava Blaze Duo 5G با طراحی زیبا، Dimensity 7025 و نمایشگر ثانویه 1.58 اینچی
- معرفی نسل جدید مدل هوش مصنوعی Gemini 2.0 با قابلیت تبدیل متن به گفتار و تصویر