كوالكوم مسدس 685 DSP هو نعمة للتعلم آلة

يعد Snapdragon 845 - وهو أحدث نظام قائم على الشريحة في عائلة Qualcomm's Snapdragon - من أقوى المعالجات. إنه يتميز بنواة وحدة المعالجة المركزية السريعة ، ومعالج إشارة صور Spectra من الجيل الثالث (ISP) ، وبنية تزيد كفاءة الطاقة بنسبة 30 بالمائة عن الجيل السابق. ولكن يمكن القول إن المكون الأكثر إثارة للإعجاب هو المعالج المشارك - Hexagon 685 DSP - الذي تم تصميمه خصيصًا للذكاء الاصطناعي والتعلم الآلي.

ما الذي يجعل علامة كوالكوم السداسية 685 DSP؟

هيكل مسدس DSP في Snapdragon 835. المصدر: كوالكوم

"الرياضيات المتجهات هي أساس التعلم العميق." - ترافيس لانيير ، مدير أول لإدارة المنتجات في كوالكوم

لفهم ما الذي يجعل برنامج Hexagon DSP فريدًا من نوعه ، فإنه يساعد على معرفة أن الذكاء الاصطناعى مدفوع بنوع من التخصصات الهندسية في كلية الرياضيات على دراية تامة. يتضمن التعلم الآلي حسابًا مع المتجهات الكبيرة ، مما يشكل تحديًا لمعالجات الهاتف الذكي والكمبيوتر اللوحي وأجهزة الكمبيوتر. من الصعب على الرقائق ذات الأغراض العامة حساب الخوارزميات مثل النسب المتدرج العشوائي - أنواع الخوارزميات التي هي في صلب التطبيقات التي تعمل بنظام AI - بسرعة وكفاءة. تم تقديم Hexagon DSP من Qualcomm جزئيًا لحل هذه المشكلة: إنه أمر رائع في التعامل مع بيانات الصورة وأجهزة الاستشعار ، وخاصة التصوير الفوتوغرافي.

لكن Hexagon DSP قادر على أكثر من مجرد تكوين صور شخصية. سياقات HVX المضمنة (أكثر على تلك لاحقًا) تمنحها ميزة كل من معالجات للأغراض العامة والنوى ذات الوظيفة الثابتة ؛ يتميز Hexagon 685 DSP بكفاءة هائلة في حساب الرياضيات وراء تعلم الآلة على الجهاز ، ولكنه يحتفظ بمرونة المعالجات الأكثر برمجة.

تم تصميم رقائق الذكاء الاصطناعي مثل Hexagon 685 DSP ، والتي يشار إليها أحيانًا باسم "وحدات المعالجة العصبية" ، أو "المحركات العصبية" ، أو "مراكز التعلم الآلي" ، على وجه التحديد للاحتياجات الرياضية لخوارزميات الذكاء الاصطناعي. إنها أكثر صلابة في التصميم من وحدات المعالجة المركزية التقليدية ، وتحتوي على إرشادات وترتيبات خاصة (في هيكل HXX 685 DSP ، بنية HVX المذكورة أعلاه) والتي تسرع بعض العمليات العددية والمتجهات ، والتي أصبحت ملحوظة في عمليات التنفيذ واسعة النطاق.

يستطيع جهاز Hexagon 685 DSP من Snapdragon 845 التعامل مع الآلاف من وحدات وحدات مكافحة ناقلات لكل دورة معالجة ، مقارنة بمئات وحدات البت في وحدة المعالجة المركزية في المتوسط ​​لكل دورة. هذا حسب التصميم. بفضل أربعة مؤشرات ترابطية متوازنة لعمليات Word Long Instruction Word (VLIW) وسياقات HVX المتعددة ، فإن DSP قادر على تجميع وحدات تنفيذ متعددة بناءً على تعليمة واحدة واشتعال النيران من خلال عدد صحيح وعشري ثابت.

بدلاً من دفع الأداء خلال ميغاهيرتز خام ، يهدف تصميم Hexagon 685 إلى مستويات عالية من العمل لكل دورة بسرعة أقل على مدار الساعة. وهو يتضمن ترابط الأجهزة المتعددة الذي يعمل بشكل جيد مع VLIW ، حيث أن خطوط الأنابيب لخطوط الأنابيب لإخفاء خيوط الخيوط المتعددة تتيح الاستخدام الأفضل لحزم VLIW. يعني خيوط المعالجة المتعددة للـ DSP أنه يمكنه خدمة جلسات إلغاء التحميل المتعددة - أي التطبيقات المتزامنة للصوت والكاميرا ورؤية الكمبيوتر وما إلى ذلك - وتسريع المهام المختلفة بشكل متزامن ، مما يمنع التطبيقات من القتال من أجل وقت التنفيذ.

المصدر: كوالكوم

ولكن هذه ليست هي نقاط القوة الوحيدة في مسدس DSP. تتميز بنية مجموعة التعليمات (ISA) بكفاءة مُحسّنة على تقنية VLIW التقليدية بفضل رمز التحكم المُحسّن ، كما تستخدم حيلًا ذكية لاستعادة الأداء من الخيوط الخاملة والمتوقفة. كما أنها تنفذ جدولة مؤشر ترابط صفر روبن زمن انتقال الكمون ، وهذا يعني أن مؤشرات الترابط DSP معالجة التعليمات الجديدة مباشرة بعد الانتهاء من حزمة البيانات السابقة.

المصدر: كوالكوم

لا شيء من هذا جديد ، ليكون واضحا. قدمت Qualcomm "الجيل الأول" (أو المناسب) Hexagon DSP - Hexagon 680 أو QDSP6 v6 - إلى جانب Snapdragon 820 في عام 2015 ، ثم Hexagon 680 تلاها Hexagon 682 المحسّن بشكل طفيف الجيل هو الأكثر تطوراً حتى الآن ، ويوفر ما يصل إلى ثلاثة أضعاف الأداء العام لجهاز DSP Snapdragon 835.

يرجع الفضل في ذلك إلى حد كبير إلى HVX ، والتي عملت بشكل جيد للغاية لمعالجة الصور (فكر في الواقع المعزز ، رؤية الكمبيوتر ، الفيديو ، والصور). يمكن التحكم في سجلات HVX الخاصة بـ DSP عن طريق أي من سجلات التسجيل العددية ، ويمكن استخدام وحدات HVX ووحدات القياس في وقت واحد ، مما يؤدي إلى تحقيق مكاسب كبيرة في الأداء وتزامن.

إليك شرح كوالكوم:

"لنفترض أنك تقوم بمعالجة وحدة المعالجة المركزية المحمولة في وضع رمز التحكم ويمكنك التبديل إلى الوضع الحسابي على المعالج الثانوي. إذا كنت بحاجة إلى أي رمز تحكم ، فيجب عليك التوقف والعودة من المعالج الثانوي إلى وحدة المعالجة المركزية الرئيسية. مع Hexagon ، يمكن تشغيل كل من معالج رمز التحكم في DSP ومعالج التعليمات البرمجية الحسابي على HVX في نفس الوقت من أجل الاقتران المحكم للرمز والرمز الحسابي. يسمح ذلك لـ DSP بأخذ نتيجة حساب HVX واستخدامه في قرار رمز التحكم في دورة الساعة التالية. "

يوفر HVX ميزة كبيرة أخرى في معالجة مستشعر الصورة. يمكن لأجهزة Snapdragon المزودة بـ Hexagon 685 DSP دفق البيانات مباشرةً من مستشعر التصوير إلى الذاكرة المحلية لـ DSP (ذاكرة التخزين المؤقت L2) ، متجاوزة وحدة تحكم ذاكرة DDR بالجهاز. هذا يقلل من الكمون ، بالطبع ، ولكنه يحسن أيضًا من عمر البطارية - تم تصميم معالج Snapdragon للتوقف خلال العملية.

تم تحسينها خصيصًا لشبكات الفاصلة العائمة 16 بت ، ويتم التحكم فيها بواسطة برنامج تعلم الآلة الخاص بـ Qualcomm: Snapdragon Neural Processing Engine.

قال متحدث باسم كوالكوم: "لقد أخذنا الأمر على محمل الجد". "لقد كنا نعمل مع الشركاء على مدار السنوات الثلاث الماضية لجعلهم يستخدمون [...] السيليكون لدينا في التصوير الذكي والتصوير".

يتضمن هؤلاء الشركاء Google ، التي تستخدم جزء معالجة الصور الخاص بـ Hexagon DSP لتشغيل خوارزمية HDR + Pixel و Pixel 2's ، على سبيل المثال. على الرغم من أن Google قدمت Pixel Core أيضًا ، إلا أنه من الجدير بالملاحظة أن الأجهزة التي تدعم Hexagon 685 DSP هي الأجهزة التي تحقق أفضل النتائج مع منفذ كاميرا Google الشهير ، ويرجع ذلك جزئيًا إلى (كما أكدنا) استخدام HVX. عمل Facebook ، شريك آخر ، بشكل وثيق مع شركة Qualcomm لتسريع فلاتر الكاميرا وآثارها في الوقت الفعلي لبرنامج Messenger.

قامت Oppo بتحسين تقنية فتح وجهها لـ Hexagon 685 DSP ، وطورت Lenovo ميزة اكتشاف المعالم من حولها.

أحد أسباب ثروة منصة الدعم هو بساطته. يدعم Hexagon SDK الشامل من Qualcomm لغة Halide لمعالجة الصور عالية الأداء ، ولا داعي للقلق بشأن أطر التدريب على التعلم الآلي - تطبيق نموذج بسيط مثل إجراء مكالمة API ، في معظم الحالات.

"نحن لسنا [...] نتنافس مع أمثال IBM و Nvidia [في AI] ، لكن لدينا مجالات يمكن للمطورين الاستفادة منها - ولدينا بالفعل" - أخبر كوالكوم للمطورين.

مسدس مقابل المنافسة

يأتي Hexagon 685 DSP من Snapdragon 845 في الوقت الذي يتابع فيه عدد متزايد من الشركات المصنعة للمعدات الأصلية (OEM) حلول الذكاء الاصطناعي المحمولة والجهازية الخاصة بهم. تمتلك Kirin 970 من Huawei - النظام القائم على الرقاقة داخل Mate 10 و Mate 10 Pro - "وحدة معالجة عصبية" (NPU) يمكن أن تتعرف على أكثر من 2000 صورة في الثانية بمعدل استهلاك الطاقة بمعدل 1/50 فقط وحدة المعالجة المركزية الهاتف الذكي. ويحتوي نظام Apple A11 Bionic على رقاقة في iPhone 8 و iPhone 8 Plus و iPhone X على "محرك عصبي" يقوم بنمذجة الوجه في الوقت الحقيقي وما يصل إلى 600 مليار عملية في الثانية.

لكن كوالكوم تقول إن لاأدرية منصة Hexagon تمنحها ميزة. على عكس Apple و Huawei ، التي تجبر المطورين على استخدام واجهات برمجة التطبيقات (APIs) الخاصة ، سعى Qualcomm إلى دعم بعض أطر العمل مفتوحة المصدر الأكثر شهرة من البداية. على سبيل المثال ، عملت مع Google لتحسين TensorFlow ، منصة التعلم الآلي من Google ، من أجل Hexagon 685 DSP - تقول Qualcomm إنها تعمل بسرعة تصل إلى ثمانية أضعاف و 25 مرة أكثر كفاءة في استهلاك الطاقة من الأجهزة غير المسدسة.

المصدر: كوالكوم

في بنية DSP الخاصة بشركة Qualcomm ، أظهرت Google GoogLeNet Inception Deep Neural Network - وهي خوارزمية للتعلم الآلي مصممة لتقييم جودة أنظمة اكتشاف الكائنات وتصنيفها - مكاسب في عرض توضيحي يعرض أحد تطبيقات التعرف على الصور التي تعمل بنظام TensorFlow على هاتفين ذكيين: أحدهما يدير التطبيق على وحدة المعالجة المركزية ، والآخر الذي يقوم بتشغيله على كوالكوم السداسي DSP. والتقط تطبيق الهاتف الذكي المعجل به DSP مزيدًا من الصور في الثانية ، وحدد الكائنات بشكل أسرع ، وكان لديه ثقة أعلى في استنتاجه بشأن ما كان عليه الكائن من تطبيق وحدة المعالجة المركزية فقط.

تستخدم Google أيضًا Hexagon 685 DSP لتسريع Project Tango ، منصة الواقع المعزز للهواتف الذكية. يستفيد كل من لينوفو Phab 2 Pro و Asus's ZenFone AR والأجهزة الأخرى التي تحتوي على وحدة الأشعة تحت الحمراء لتانغو وكاميرات تتبع الصور من Qualcomm's Heterogeneous Processing Architecture ، التي تفوض مهام المعالجة بين Hexagon 685 DSP من Snapdragon ومجموعة محاسيس الصورة معالج الإشارة (ISP). والنتيجة هي "أقل من 10 بالمائة" من الحمل على وحدة المعالجة المركزية للنظام على الرقاقة ، وفقًا لشركة كوالكوم.

وقال متحدث باسم كوالكوم: "على حد علمنا ، نحن الأشخاص الوحيدون المتنقلين هناك الذين يقومون بتحسين الأداء وكفاءة الطاقة".

بطبيعة الحال ، يعمل المنافسون أيضًا على توسيع مجال نفوذهم وتعزيز دعم المطورين على منصاتهم. تم إطلاق الشريحة العصبية لـ Kirin 970 بدعم من TensorFlow و Caffe (إطار عمل API المفتوح على Facebook) بالإضافة إلى واجهات برمجة تطبيقات Kirin من Huawei ، مع تكامل TensorFlow Lite و Caffe2 في وقت لاحق من هذا العام. عملت Huawei مع Microsoft لتحسين المترجم الذي يعمل بنظام AI من أجل Mate 10.

لكن كوالكوم لديه ميزة أخرى: الوصول. استحوذت شركة تصنيع الرقاقات على 42 بالمائة من سوق شرائح الهواتف الذكية في النصف الأول من عام 2017 ، تليها Apple و MediaTek بنسبة 18 بالمائة لكل منهما ، وفقًا لاستراتيجية التحليلات. يكفي القول ، إنه لا يهتز في حذائه بعد.

وتتوقع كوالكوم أنها سوف تنمو فقط. تتوقع شركة صناعة الرقاقات إيرادات بقيمة 160 مليار دولار بحلول عام 2025 من خلال تقنيات برمجيات الذكاء الاصطناعي مثل رؤية الكمبيوتر ، وتعتبر سوق الهواتف الذكية - الذي يتوقع أن يصل إلى 8.6 مليار وحدة يتم شحنها بحلول عام 2021 - أكبر منصة.

مع Hexagon 685 DSP وغيرها من التحسينات "ثلاثية" بشكل مستمر في اتجاه المصب إلى الأجهزة متوسطة المدى ، من السهل أيضًا على رقائق Qualcomm أن تجلب تعلم الآلة على الجهاز لجميع أنواع الأجهزة في المستقبل القريب. كما أنها توفر SDK مفيد للمطورين (لا حاجة للتلاعب بلغة تجميع DSP) للاستفادة من Hexagon 685 DSP و HVX في تطبيقاتهم وخدماتهم.

وقال متحدث باسم كوالكوم: "هناك حاجة إلى وحدات المعالجة المخصصة للمعالجة العصبية ، لكنك بحاجة أيضًا إلى توسيعها ، حتى تتمكن من دعم أطر عمل [المصدر المفتوح]". "إذا لم تقم بإنشاء هذا النظام الإيكولوجي ، فلا توجد طريقة [...] يمكن للمطورين إنشاءه".