معرفی پروژه تریلیوم ARM، شامل طراحی پردازندههای یادگیری ماشینی و تشخیص شئ
نمایش خبر
تاریخ : 1396/11/27 نویسنده: مسعود بهرامی شرق | ||
برچسبها : | آرم ARM ، هوش مصنوعی Artificial Intelligence ، یادگیری ماشین Machine Learning ، پردازنده Processor |
واحد خبر mobile.ir : اخیرا NPUها یا "واحدهای پردازش عصبی" به موضوعی بحثبرانگیز تبدیل شده و مقالات فراوانی در این زمینه به نگارش درآمدهاند. واحد پردازش عصبی میتواند استنتاج یادگیری ماشینی را – بدون استفاده از رایانش ابری – روی اسمارتفونها پیادهسازی کند. هواوی با تولید چیپست Kirin 970 (مجهز به NPU)، به پیشرفتهای خوبی در زمینه پردازندههای مخصوص هوش مصنوعی دست یافت. اما کمپانی ARM – طراح اصلی پردازندههایی چون Cortex-A73 و Cortex-A75 – به تازگی از طراحی پلتفرمی جدید در یادگیری ماشینی، تحت عنوان پروژه تریلیوم (Project Trillium) خبر داده است. این پروژه، از یک پردازنده یادگیری ماشینی (ML) و نسل دوم پردازندههای تشخیص شئ (OD) تشکیل شده که توسط نرمافزاری متنباز در زمینه شبکههای عصبی (NN) توسعه خواهد یافت.
همانطور که میدانید، شرکت انگلیسی ARM، هیچ چیپستی را تولید نمیکند بلکه در زمینه طراحی پردازندهها فعالیت دارد. ARM به قدری در این کار توانمند است که ردپای معماریهایش عملا در همه پردازندههای اسمارتفونها، دوربینها و دیوایسهای اینترنت اشیا دیده میشود. شاید برایتان جالب باشد که شرکای ARM تا کنون بیش از 125 میلیارد تراشه را بر مبنای معماریهای ARM عرضه کردهاند. حال، این کمپانی قصد دارد پردازندههای جدیدی را در زمینههای یادگیری ماشینی (ML) و تشخیص شئ (OD) طراحی کند؛ پردازندههای ML به منظور انجام پردازشهای کلی حوزه هوش مصنوعی و پردازندههای OD برای تشخیص چهرهها، افراد، حالتهای آنها و ... طراحی میشوند.
در ابتدا به پردازنده یادگیری ماشینی میپردازیم. این پردازنده – با طراحی جدید و متفاوت از اجزای قبلی ARM – برای عملکرد و کارایی بالا طراحی شده است. به گفته ARM، عملکرد این پردازنده در استنتاج (Inference)، در مقایسه با CPUها، GPUها و DSPها، افزایش یافته که این امر با استفاده از شبکههای عصبی از پیش آموزش دیده (pre-trained neural networks) تحقق مییابد. ARM همواره از نرمافزارهای متنباز پشتیبانی کرده و پروژه تریلیوم نیز از طریق نرمافزار متنباز اجرا خواهد شد.
اگر با مفاهیمی چون یادگیری ماشینی و شبکههای عصبی آشنایی ندارید، به توضیحات زیر توجه کنید: شبکههای عصبی یکی از چندین تکنیک متفاوتی به حساب میآید که در یادگیری ماشینی از آن استفاده میشود تا شناسایی اشیا در تصاویر، کلام یا هر چیز دیگر را به کامپیوتر آموزش دهد. یک شبکه عصبی برای شناسایی اشیا، بایستی آموزش ببیند. به این ترتیب که ابتدا اشیای نمونه (تصاویر، صداها و ...) به همراه طبقهبندی درست آنها، به شبکه وارد میشوند. سپس شبکه با استفاده از تکنیک بازخورد، آموزش میبیند. این روند برای تمام ورودیها در "دادههای آموزشی" تکرار میشود. به محض آموزش دیدن، شبکه قادر است خروجی مناسب را ارائه دهد، حتی زمانی که ورودیها قبلا دیده نشده باشند.
این فرآیند در نگاه اول ساده به نظر میرسد، اما در عین حال، میتواند بسیار پیچیده باشد. با تکمیل پروسه آموزش، شبکه عصبی به یک مدل ایستا تبدیل شده و میتواند برای استنتاج در میلیونها دیوایس به کار گرفته شود (منظور از استنتاج، طبقهبندی و شناسایی ورودیهای دیده نشده است). گفتنیست، مرحله استنتاج از مرحله آموزش آسانتر بوده و پردازنده جدید ARM نیز در همین مرحله مورد استفاده قرار خواهد گرفت.
به گفته جم دیویس (Jem Davies)، مدیر داخلی ARM در حوزه یادگیری ماشینی، شرکت میتوانست در طراحی این پردازندهها از داشتههای قبلی خود کمک بگیرد و به تکمیل آنها بپردازد، اما نهایتا تصمیم بر آن شد که یک طراحی کاملا جدید ارائه شود. وی میافزاید: «بسیاری از بخشهای بازار ما با محدودیت انرژی مواجهند، لذا احتیاج داشتیم آن طراحی جدید کممصرف و کارآمد باشد.» با وجود اینکه تیم طراح میتوانست در این زمینه روی معماری GPUهای کنونی خود کار کرده و آن را گسترش دهد، اما به گفته دیویس، GPUها در مدیریت حافظه چندان عالی عمل نمیکنند.
نسل اول این پردازندههای ML، دیوایسهای موبایل را هدف گرفته و طبق ادعای ARM، بالاترین عملکرد در میلیمتر مربع، به این پردازنده تعلق خواهد داشت. ARM توان عملیاتی آن را (در لیتوگرافی 7 نانومتری) بیش از 4.6 تریلیون عمل در ثانیه اعلام کرده و انتظار دارد با بهینهسازیهای بعدی، این عدد بالاتر هم برود. پیدا کردن تعادل مناسب بین توان و عمر باتری، بخش مهمی از عمده کار ARM بوده و البته به گفته مسئولین شرکت، تیم طراح در این زمینه به ترکیب موردنظر خود دست یافته است. البته کمیت تریلیون عملیات در ثانیه (TOPs) به تنهایی نمیتواند معیار خوبی برای نشان دادن قدرت یک پردازنده باشد، اما در حال حاضر – تا زمانی که صنعت بتواند معیار بهتری برای سنجش پیدا کند – گزینه مناسبی است.
میرسیم به دومین جزء پروژه تریلیوم یعنی پردازنده تشخیص شئ (OD). برای تقریب این مفهوم به ذهن، باید بگوییم چیزی شبیه به همان فناوری تشخیص چهره در دوربین اسمارتفونهاست، البته به مراتب پیشرفتهتر. به گفته ARM، این پردازنده OD جدید میتواند عمل تشخیص افراد را (در ویدئوی فول اچدی با سرعت 60 فریم در ثانیه) بدون هیچ وقفهای و به شکل بیدرنگ انجام دهد. عمل تشخیص، مواردی چون جهت چهره افراد و اینکه چهقدر از بدن او قابل مشاهده است را نیز در بر میگیرد. مثلا این پردازنده میتواند حالتهای زیر را تشخیص دهد: جهت سر به سمت راست، بالاتنه به سمت بالا، کل بدن به سمت چپ و ... . به نظر میرسد این پردازنده، نتیجه خرید کمپانی تصویربرداری Apical توسط ARM در سال 2016 باشد. گفتنیست، این نسل دوم پردازندههای تشخیص شئ ARM بوده و نسل اول این پردازندهها در ساخت دوربینهای هوشمند امنیتی Hive به کار گرفته شده بود.
ARM انتظار دارد بسیاری از کمپانیها، هر دو تراشه یادگیری ماشینی و تشخیص شئ را با هم استفاده کنند. از ترکیب دو پردازنده ML و OD، سیستم قدرتمندی حاصل میشود که میتواند ابتدا شئ را تشخیص داده و سپس با استفاده از یادگیری ماشینی، آن را شناسایی کند. این بدان معناست که پردازنده ML تنها روی آن بخش از تصویر کار میکند که حاوی شئ دلخواه است. به عنوان مثال، اگر چنین سیستمی در اپلیکیشن دوربین پیادهسازی شود، ابتدا امکان تشخیص چهره افراد در فریم را فراهم میکند و سپس با استفاده از یادگیری ماشینی، آن چهرهها را شناسایی میکند.
مثالی که ARM در این زمینه بیان کرده، یک ماسک غواصی مجهز به واقعیت افزوده است که میتواند نام ماهیهایی را که در هنگام غواصی مشاهده میکنید، برایتان به نمایش بگذارد. اما مثال واقعگرایانهتر، میتواند راهکاری در اینترنت اشیا باشد که با استفاده از ویدئو، بر یک تقاطع شلوغ نظارت کرده و شما را در جریان باز یا مسدود بودن آن قرار میدهد. اعلام زمان مناسب برای خالی کردن سطل زباله نیز، نمونه دیگریست که به نظر می رسد امروزه کاربرد فراوانی پیدا کرده است. در مجموع، فعلا موارد استفاده این نوع تراشهها در عرصه موبایل چندان شناخته شده نیست، اما در حوزه دوربین و سیستمهای نظارتی، کاربردهای فراوانی دارند.
شاید یکی از مهمترین ویژگیهای این سیستم در آن باشد که عمل استنتاج، به جای فضای ابری، در خود دیوایس و به صورت local اتفاق میافتد. این امر چند مزیت دارد؛ نخست آنکه موجب صرفهجویی در پهنای باند میشود (با همهگیر شدن این تکنولوژیها، افزایش قابلتوجهی در تبادل داده بین دیوایس و فضای ابری به منظور شناسایی، پیشبینی میشود). دوم آنکه موجب صرفهجویی در مصرف انرژی میشود (چه در گوشی و چه در اتاق سرور). علت در آن است که با این سیستم، دیگر نیازی به روشن کردن وای-فای یا اینترنت دیتای گوشی برای ارسال و دریافت دادهها نبوده و سرور نیز برای عمل تشخیص، مورد استفاده قرار نمیگیرد. مزیت سوم آن است که با انجام عمل استنتاج در خود دیوایس، نتایج سریعتر ارائه شده و از میزان تأخیر کاسته میشود. نهایتا، چهارمین فایده این سیستم، امنیت بالای آن است، چرا که دیگر نیازی به ارسال دادههای شخصی به فضای ابری نخواهد بود.
جم دیویس ریاست بخش یادگیری ماشین و رنه هاس (Rene Haas)، رییس بخش IP Products Group در شرکت ARM، پیشبینی میکنند که بسیاری از تراشههای دارای پردازندههای فوق، در ساخت خودرو مورد استفاده قرار گیرند. در حالیکه کمپانی Nvidia با تعبیه ابرکامپیوتر در خودروها، آنها را به خودروهای بدون راننده تبدیل میکند، ARM بر این باور است که در صورت وجود محدودیتهای مکانی و حرارتی، تنها با قرار دادن این تراشههای جدید در یک آینه هوشمند، میتوان عمل تشخیص اشیا را بهخوبی انجام داد و اتومبیل را به یک وسیله نقلیه خودران تبدیل کرد. کاربرد دیگر این تراشهها، به گفته ARM، در صنعت ساخت نمایشگر است. با تجهیز نمایشگر به این تراشهها، میتوان تدبیری اندیشید که ویدئوی در حال پخش، بر اساس محتوای نمایشی، تنظیم شده و کیفیت آن بهبود یابد.
اما میرسیم به قسمت سوم پروژه تریلیوم، یعنی بخش نرمافزاری آن. این بخش متشکل از کتابخانهها و راهاندازهای نرمافزاریست که ARM در اختیار شرکایش قرار داده تا بتوانند حداکثر استفاده و بهرهوری را از دو پردازنده ML و OD داشته باشند. این کتابخانهها و راهاندازها برای مهمترین قالبهای شبکههای عصبی بهینهسازی شدهاند، از جمله TensorFlow، Caffe و رابط برنامهنویسی Android Neural Networks. نرمافزارهای موردنیاز، از روز سهشنبه 13 فوریه (24 بهمن) در وبسایت توسعهدهندگان ARM و همچنین در وبسایت Github، در اختیار توسعهدهندگان قرار گرفته است.
انتظار میرود طراحی پردازنده OD در سهماهه نخست 2018 به دست شرکای ARM برسد. اما طراحی پایانی پردازنده ML احتمالا در نیمه سال 2018 به اتمام رسیده و پس از تحویل به شرکا (در بهترین حالت) امید است در اواسط یا اواخر سال 2019 شاهد عرضه چیپستهای مجهز به این پردازنده باشیم.
در پایان گفتنیست، اخیرا تعدادی از کمپانیهای سازنده اسمارتفون در محصولاتشان از تراشههای هوش مصنوعی ساخت خود استفاده میکنند. به عنوان نمونه میتوان به تراشه پردازشگر تصویر Pixel Visual Core (محصول گوگل)، Neural Engine (موتور عصبی) در تراشه A11 (محصول اپل) و چیپست Kirin 970 (محصول هواوی) اشاره کرد. مشخص است که در چنین شرایطی، ARM به دنبال سهم خود از این کسبوکار میگردد.
- معرفی Realme GT7 Pro با بدنه IP69، باتری 6,500mAh و پردازنده Snapdragon 8 Elite
- گزارش مالی اپل از سهماهه منتهی به سپتامبر 2024 – رکورد درآمد، کاهش اجباری سود!
- گزارش مالی سامسونگ از سهماهه سوم 2024 – افت سود 40 درصدی در بخش نیمهرسانا
- گزارش مالی مایکروسافت از سهماهه منتهی به سپتامبر 2024 – کاهش فروش Xbox، درآمدزایی سایر بخشها
- معرفی OnePlus 13 با بدنه IP69، باتری 6,000mAh و پردازنده Snapdragon 8 Elite
- معرفی iQOO 13 با پردازنده Snapdragon 8 Elite، باتری 6,150mAh و عقبگرد در دوربینها!
- گزارش مالی آلفابت از سهماهه سوم 2024 – عملکرد فوقالعاده، افزایش درآمد همه بخشها