إحضار الذكاء الاصطناعي ترجمه إلى أجهزه الحافة مع مترجم Microsoft
في تشرين الثاني/نوفمبر 2016 ، جلبت مايكروسوفت الاستفادة من الترجمة اليه التي تعمل بالطاقة الذكاء الاصطناعية ، ويعرف أيضا باسم اله العصبية الترجمة (nmt) ، للمطورين والمستخدمين النهائيين علي حد سواء. الأسبوع الماضي مايكروسوفت جلبت القدرة nmt إلى حافه سحابه من خلال الاستفادة من npu ، وهو معالج مخصص للذكاء الاصطناعي مدمج في ميت 10، أحدث هاتف هواوي الرائد. الرقاقة الجديدة يجعل الترجمات التي تعمل بالذكاء الاصطناعي المتاحة علي الجهاز حتى في غياب الوصول إلى الإنترنت ، مما يتيح للنظام لإنتاج الترجمات التي جودتها علي المساواة مع النظام علي الإنترنت.
ولتحقيق هذا الإنجاز ، تعاون الباحثون والمهندسون من مايكروسوفت وهواوي في تكييف الترجمة العصبية مع بيئة الحوسبة الجديدة هذه.
وتستخدم أنظمه nmt الأكثر تقدما حاليا في الإنتاج (اي ، المستخدمة علي نطاق واسع في السحابة من قبل الشركات والتطبيقات) بنيه الشبكة العصبية التي تجمع بين طبقات متعددة من شبكات lstm، خوارزميه الانتباه ، والترجمة (فك) طبقه.
يوضح الرسم المتحرك أدناه ، بطريقه مبسطه ، كيف تعمل هذه الشبكة العصبية متعددة الطبقات. لمزيد من التفاصيل ، يرجى الرجوع إلى "ما هي صفحه الترجمة اليه"علي موقع مترجم Microsoft.
في هذه السحابة تطبيق nmt ، تستهلك هذه الطبقات lstm الأوسط جزءا كبيرا من الطاقة الحوسبة. لتكون قادره علي تشغيل كامل nmt علي جهاز محمول ، كان من الضروري العثور علي اليه التي يمكن ان تقلل من هذه التكاليف الحسابية مع الحفاظ ، قدر الإمكان ، ونوعيه الترجمة.
هذا هو المكان الذي تاتي فيه وحده المعالجة العصبية هواوي (npu) في اللعب. الباحثين والمهندسين مايكروسوفت استغل من npu ، الذي تم تصميمه خصيصا للتفوق في حسابات الذكاء الاصطناعي الكمون المنخفض ، لتفريغ العمليات التي كانت بطيئه بشكل غير مقبول لمعالجه علي وحده المعالجة المركزية الرئيسية.
تنفيذ
التطبيق المتوفر الآن علي تطبيق مترجم Microsoft ل Huawei Mate 10 يحسن الترجمة عن طريق إلغاء تحميل المهام الأكثر كثافة في الحوسبة إلى npu.
علي وجه التحديد ، يستبدل هذا التطبيق هذه الطبقات شبكه lstm الأوسط بواسطة f عميقالشبكة العصبية الاماميه. الشبكات العصبية التغذية العميقة إلى الامام قويه ولكنها تتطلب كميات كبيره جدا من الحساب بسبب الاتصال العالي بين الخلايا العصبية.
الشبكات العصبية تعتمد في المقام الأول علي المضاعفات مصفوفة ، وهي عمليه ليست معقده من وجهه نظر رياضيه ولكن مكلفه جدا عند تنفيذها علي المقياس المطلوب لمثل هذه الشبكة العصبية العميقة. وتتفوق الشركة في أداء هذه المصفوفات بطريقه متوازية علي نطاق واسع. كما انها فعاله جدا من وجهه نظر استخدام الطاقة ، ونوعيه هامه علي الاجهزه التي تعمل بالطاقة البطارية.
في كل طبقه من هذه الشبكة تغذيه إلى الامام ، يحسب npu كل من إنتاج الخلايا العصبية الخام واللاحقة relu وظيفة التنشيط بكفاءة ومع الكمون منخفضه جدا. من خلال الاستفادة من الذاكرة عاليه السرعة وافره علي npu ، فانه ينفذ هذه الحسابات في نفس الوقت دون الحاجة إلى دفع تكلفه نقل البيانات (اي تباطؤ الأداء) بين وحده المعالجة المركزية و npu.
وبمجرد حساب الطبقة النهائية لهذه الشبكة العميقة للتغذية الاماميه ، يكون للنظام تمثيل غني لجمله اللغة المصدر. ثم يتم تغذيه هذا التمثيل من خلال اليسار إلى اليمين lstm "فك" لإنتاج كل كلمه اللغة المستهدفة ، مع نفس خوارزميه الاهتمام المستخدمة في النسخة الكترونيه من nmt.
مثل أنتوني أوى، يشرح مهندس تطوير البرامج الرئيسي في فريق مترجم Microsoft: "أخذ النظام الذي يعمل علي خوادم سحابه قويه في مركز البيانات وتشغيله دون تغيير علي الهاتف المحمول ليس خيارا قابلا للتطبيق. الاجهزه المحمولة لديها قيود في الحوسبة الطاقة ، والذاكرة ، واستخدام الطاقة التي ليس لديها حلول سحابه. تمكننا من الوصول إلى npu ، إلى جانب بعض التعديلات المعمارية الأخرى ، إلى العمل حول العديد من هذه القيود وتصميم نظام يمكن تشغيله بسرعة وكفاءه علي الجهاز دون الحاجة إلى المساومة علي جوده الترجمة."
وقد سمح تنفيذ نماذج الترجمة هذه علي مجموعه شرائح npu المبتكرة ل Microsoft و Huawei بتسليم الترجمة العصبية علي الجهاز بجوده مماثله لتلك الخاصة بالانظمه المستندة إلى السحابة حتى عندما تكون خارج الشبكة.