AI

جفاف بيانات الذكاء الاصطناعي: كيف يمكن للبيانات الاصطناعية أن تطلق العنان للابتكار المستقبلي

ع
عبدالله الفضلي
· · 3 دقائق قراءة
جفاف بيانات الذكاء الاصطناعي: كيف يمكن للبيانات الاصطناعية أن تطلق العنان للابتكار المستقبلي

في عالم يعتمد بشكل متزايد على الذكاء الاصطناعي (AI)، يلوح في الأفق تحدٍ حاسم: استنفاد بيانات التدريب المتاحة بسهولة. يستكشف هذا المقال، الذي كتبه جاك هيداري، الرئيس التنفيذي لشركة SandboxAQ، للمنتدى الاقتصادي العالمي، “جفاف البيانات” الناشئ هذا ويقترح توليد البيانات الاصطناعية كحل لتغذية الموجة التالية من تطورات الذكاء الاصطناعي. تسلط المقالة الضوء على القيود المفروضة على نماذج الذكاء الاصطناعي الحالية المدربة على مجموعات البيانات الحالية وتؤكد على الحاجة إلى بيانات كمية جديدة لإطلاق الإمكانات الحقيقية للذكاء الاصطناعي عبر مختلف الصناعات. علاوة على ذلك، تناقش أهمية إنشاء أنظمة بيئية بيانات يسهل الوصول إليها لتعزيز الابتكار وتحقيق ميزة تنافسية في المستقبل الذي يقوده الذكاء الاصطناعي.

أزمة بيانات الذكاء الاصطناعي: عنق الزجاجة للتقدم

تفتتح المقالة بتحديد مشكلة واضحة: تستهلك نماذج الذكاء الاصطناعي بسرعة البيانات المتاحة، متجاوزة قدرتنا على توليد معلومات جديدة ومتنوعة. إن المضاعفة المستمرة للبيانات كل بضع سنوات ليست كافية، حيث ينقص التنوع و الابتكار في البيانات. وتشمل النقاط الرئيسية:

  • تستهلك نماذج الذكاء الاصطناعي البيانات وتدمجها بشكل أسرع من إنشاء بيانات جديدة.
  • ستنتج نماذج اللغة الكبيرة (LLMs) المدربة على نفس البيانات في النهاية مخرجات سلعية.
  • إن نقص البيانات الجديدة يعيق قدرة الذكاء الاصطناعي على حل تحديات الأعمال والعلم والمجتمع المتقدمة، لا سيما في المجالات الكمية.
  • غالبًا ما تكون التجارب الفيزيائية لتوليد بيانات جديدة بطيئة ومكلفة وأحيانًا مستحيلة.

البيانات الاصطناعية: حل واعد

تقدم المقالة مفهوم البيانات الاصطناعية كحل للتغلب على مشكلة ندرة البيانات. يتم تقديم طريقتين أساسيتين لتوليد مجموعات بيانات جديدة:

  • الأتمتة: استخدام الروبوتات وأجهزة الاستشعار المتقدمة لإجراء تجارب فيزيائية مستمرة. ومع ذلك، يعتبر هذا النهج غير فعال من حيث التكلفة ويقلل من تعلم الإنسان.
  • الحوسبة: استخدام مجموعات بيانات متنوعة وقوانين فيزيائية ونماذج حسابية عميقة لمحاكاة الأنظمة المعقدة. هذه الطريقة أسرع وأكثر أمانًا وفعالية من حيث التكلفة وأكثر دقة.

تؤكد المقالة أيضًا على أهمية النماذج الكمية الكبيرة (LQMs):

  • يتم تدريب LQMs على معادلات المبادئ الأولى (الفيزياء والكيمياء والأحياء).
  • أنها تولد تفسيرات سببية قابلة للتدقيق وبيانات جديدة غير متوفرة في الأدبيات الحالية.
  • يمكن لـ LQMs تسريع البحث والتطوير عبر الصناعات، ويتضح ذلك من خلال قدرتها على إحداث ثورة في اكتشاف الأدوية.

بناء نظام بيئي للبيانات الاصطناعية للابتكار

تؤكد المقالة على أهمية الوصول إلى مجموعات البيانات الاصطناعية لابتكار الذكاء الاصطناعي. وهذا يشمل:

  • الوصول المستند إلى النظام الأساسي إلى النماذج التأسيسية، مما يتيح مشاركة أوسع دون المساس بخصوصية البيانات أو الملكية الفكرية.
  • تبادل موارد البيانات (مثل مجموعات المرضى الافتراضية) لتسهيل البحث والتطوير التعاوني.
  • إضفاء الطابع الديمقراطي على الوصول لتسريع حل المشكلات على نطاق واسع، لا سيما في مجالات مثل الطب الشخصي والتمويل وعلوم المواد والطاقة.

الميزة الاستراتيجية لتوليد البيانات

يتم تصوير القدرة على توليد البيانات ليس فقط كميزة تقنية ولكن أيضًا كميزة استراتيجية. سيؤدي التحول من دورات “التصميم والبناء والاختبار” إلى سير عمل “المحاكاة والتحسين والتحقق من الصحة” إلى تحقيق ميزة تنافسية في الصناعات الرئيسية:

  • علوم الحياة: يمكن لبيانات المرضى الاصطناعية تسريع تطوير الأدوية وتحسين التنبؤ بالتجارب السريرية.
  • التمويل: يمكن لمحاكاة السوق أن تعزز اختبارات الإجهاد للمحافظ والاستعداد للمخاطر الجديدة.
  • التصنيع: يمكن للنماذج الرقمية للمواد أن تؤدي إلى اكتشاف مركبات وسبائك فائقة.
  • الطاقة: يؤدي تحويل النفايات إلى منتجات عالية القيمة إلى تحسين الاستدامة وإنشاء مصادر دخل جديدة.

هندسة مستقبل يعتمد على البيانات أولاً

تختتم المقالة بحث قادة الأعمال والحكومات على إعطاء الأولوية للاستثمار في طرق جديدة لتوليد البيانات، والدعوة إلى “هندسة تعتمد على البيانات أولاً” لإطلاق العنان لذكاء الذكاء الاصطناعي الجماعي. يتطلب هذا الانتقال تنمية المواهب والشراكات والأطر التي تمكن المؤسسات من الازدهار في عصر يقوده وفرة الإمكانيات المستقبلية، وليس ندرة الملاحظات التاريخية.


المصدر: World Economic Forum

مقالات ذات صلة