AI

نشر نماذج اللغات الصغيرة على الحافة باستخدام AWS IoT Greengrass ووكلاء Strands

ع
عبدالله الفضلي
· · 3 دقائق قراءة
نشر نماذج اللغات الصغيرة على الحافة باستخدام AWS IoT Greengrass ووكلاء Strands

تسعى الشركات المصنعة الحديثة ومختلف الصناعات الأخرى بشكل متزايد إلى إيجاد طرق للاستفادة من الحلول المدعومة بالذكاء الاصطناعي لمعالجة البيانات في الوقت الفعلي واتخاذ القرارات الذكية على الحافة. توضح هذه المدونة كيفية نشر نماذج اللغات الصغيرة (SLMs) على نطاق واسع باستخدام AWS IoT Greengrass ووكلاء Strands، مما يتيح رؤى واعية بالسياق مباشرة على أجهزة الحافة مع الحفاظ على الأمان والأداء. على عكس نظيراتها الأكبر حجمًا، تم تصميم SLMs لتناسب القيود المفروضة على الموارد في البيئات الصناعية، مما يجعلها مثالية للسيناريوهات التي يكون فيها الموثوقية وزمن الاستجابة المنخفض أمرًا بالغ الأهمية.

الفوائد وحالات الاستخدام الرئيسية

  • رؤى في الوقت الفعلي: تمكن المشغلين من الاستعلام عن حالة المعدات وتفسير بيانات القياس عن بعد والوصول إلى الوثائق على الفور دون اتصال سحابي.
  • النهج المختلط: يجمع بين الاستدلال المحلي للاستجابات الفورية مع الموارد السحابية للتحليلات المعقدة وتحسين المواقع المتعددة وإعادة تدريب النموذج.
  • تطبيقات متعددة الاستخدامات: قابلة للتطبيق في مختلف الصناعات، بما في ذلك السيارات (الأوامر الصوتية)، والطاقة (معالجة بيانات SCADA)، والألعاب (الذكاء الاصطناعي المصاحب)، والتعليم العالي (التعلم المخصص).

نظرة عامة على الحل

تستفيد البنية من AWS IoT Greengrass لنشر وإدارة SLMs على أجهزة الحافة، ويكملها وكلاء Strands لقدرات الوكيل المحلي. تشمل خدمات AWS الرئيسية المستخدمة:

  • AWS IoT Greengrass: ينشر ويدير ويراقب برامج الأجهزة على الحافة.
  • AWS IoT Core: يربط أجهزة إنترنت الأشياء بشكل آمن بسحابة AWS.
  • Amazon S3: يخزن ويسترجع ملفات نماذج SLM بتنسيق GGUF.
  • وكلاء Strands: يوفر إطار عمل Python لتشغيل أنظمة متعددة الوكلاء، وتنظيم الاستدلال المحلي والسحابي.

يستخدم الحل محاكي OPC-UA لتمثيل بيئة المصنع مع فرن وحزام ناقل، بالإضافة إلى كتيبات الصيانة للبيانات الصناعية. يتقدم سير العمل على النحو التالي:

  1. يتم تحميل ملف النموذج بتنسيق GGUF إلى حاوية Amazon S3 يمكن الوصول إليها بواسطة أجهزة AWS IoT Greengrass.
  2. تتلقى الأجهزة مهمة تنزيل الملفات التي يتم التعامل معها بواسطة مكون S3FileDownloader، والذي يدير عمليات نقل الملفات الكبيرة بكفاءة.
  3. يتم تحميل النموذج في Ollama، وهو برنامج يقوم بتشغيل الاستدلال على ملفات نماذج GGUF، عند استدعائه لأول مرة بواسطة مكون وكلاء Strands.
  4. يتم إرسال استعلام المستخدم إلى الوكيل المحلي عبر موضوع MQTT خاص بالجهاز في AWS IoT Core.
  5. يستخدم Strands Agents SDK وكيل Orchestrator الخاص به لفهم الاستعلام وتحديد مصادر المعلومات ذات الصلة والتفويض إلى وكلاء متخصصين مثل وكيل التوثيق ووكيل OPC-UA.
  6. يسترجع وكيل التوثيق المعلومات من المستندات، ويستعلم وكيل OPC-UA عن خادم OPC-UA للحصول على بيانات الجهاز في الوقت الفعلي أو التاريخية.
  7. يقوم وكيل Orchestrator بتجميع المعلومات ونشر استجابة إلى موضوع استجابة خاص بالجهاز.
  • Strands Agents SDK: يسهل التفاعل مع النماذج المنشورة محليًا (Ollama) ويوفر المرونة للتبديل إلى النماذج المستندة إلى السحابة مثل تلك الموجودة في Amazon Bedrock عند توفرها.
  • دور IAM وشهادة إنترنت الأشياء: تمكن الوصول الآمن إلى موارد S3 واتصالات MQTT مع AWS IoT Core.
  • تسجيل الدخول: يتم تسجيل تشغيل المكون محليًا، مع تكامل اختياري مع AWS CloudWatch للمراقبة المستندة إلى السحابة.

تجول في النشر

توفر المدونة تجولًا تفصيليًا بما في ذلك الخطوات التالية:

  1. استنساخ مستودع وكلاء Strands من GitHub.
  2. استخدم Greengrass Development Kit (GDK) CLI لإنشاء ونشر المكون. يعد تكوين ملف gdk-config.json (المنطقة والحاوية) مطلبًا.
  3. نشر المكون على جهاز الحافة عبر وحدة تحكم AWS IoT Greengrass.

للاختبار في مثيل Amazon EC2، يتم توفير قالب CloudFormation لنشر مثيل GPU مع البرامج المثبتة مسبقًا وموارد Greengrass الضرورية.

إدارة ملفات النموذج

يعد تنزيل ملف SLM خطوة حاسمة:

  • يجب وضع ملف النموذج بتنسيق GGUF ضمن /tmp/destination/ على جهاز الحافة وتسميته model.gguf.
  • بدلاً من ذلك، يمكن استخدام مكون S3FileDownloader لتنزيل ملف النموذج من حاوية S3، مما يوفر إمكانات إعادة المحاولة والاستئناف التلقائي لسيناريوهات الاتصال غير الموثوق بها. يتم إعطاء حمولة نموذجية لمكون S3FileDownloader لتشغيل التنزيل.

الاختبار والمراقبة

يتضمن اختبار الوكيل المنشور الاشتراك في موضوع MQTT خاص بالجهاز ونشر استعلام. تتضمن المدونة مثالاً للاستعلام للتحقق من حالة الحزام الناقل وتوضح تنسيق الاستجابة المتوقع، بما في ذلك الاستجابات النهائية والفرعية للوكيل. يتم تحقيق مراقبة تشغيل المكون عن طريق التحقق من سجلات المكون الموجودة في /greengrass/v2/logs/com.strands.agent.greengrass.log.

خاتمة

أظهرت هذه المشاركة كيفية نشر SLM محليًا باستخدام AWS IoT Greengrass، وعرضت إمكانات الذكاء الاصطناعي للحافة في التصنيع والقطاعات الأخرى. يتيح تكامل SLMs من خلال وكلاء Strands على الأجهزة ذات الموارد المحدودة اتخاذ القرارات في الوقت الفعلي وتحسين الكفاءة. تختتم المشاركة بتصور نظام ذكاء اصطناعي مختلط بين السحابة والحافة حيث تتعامل وكلاء الحافة مع المعالجة في الوقت الفعلي ويدير وكلاء السحابة التفكير المعقد، مما يوفر حلاً قابلاً للتطوير وقابلاً للتكيف للأتمتة الذكية.


المصدر: AWS - Amazon Web Services