نموذج ذكاء اصطناعي يحول الطلبات إلى أفعال

نموذج جديد للذكاء الصناعي ينفذ الأوامر بشكل اسرع و یحول جمیع الطلبات بشکل سریع الی افعال

كشفت شركة “مايكروسوفت” عن تطويرها لنموذج ذكاء اصطناعي جديد، يتميز بقدرته على تشغيل برامج “ويندوز” وتنفيذ المهام بنحو مستقل، ويشكل هذا النموذج نقلة نوعية في الذكاء الاصطناعي القادر على تنفيذ الأوامر فعليا.


يطلق على هذا النموذج من الذكاء الاصطناعي الجديد اسم “Large Action Model” أو (LAM)، وعلى عكس النماذج اللغوية التقليدية، مثل (GPT-4o)، التي تقتصر وظيفتها على معالجة النصوص وإنشائها، يتمتع نموذج “LAM” الجديد من شركة “مايكروسوفت” بالقدرة على تحويل طلبات المستخدمين إلى أفعال حقيقية، سواء كان ذلك تشغيل البرامج أو التحكم في الأجهزة.

مايكروسوفت


ووفقا لصحيفة “هسبريس” التي نقلت الخبر، فقد كانت هذه الفكرة موجودة سابقا، لكن “LAM” يعد أول نموذج يدرب بنحو خاص للعمل مع منتجات “مايكروسوفت أوفيس” المكتبية وغيرها من تطبيقات “ويندوز”.


ويمكن للنموذج الجديد القيام بعدد من المهام كعملية الشراء من خلال التنقل في واجهة المواقع، على عكس النماذج التقليدية التي يقتصر دورها على تقديم تعليمات نصية حول كيفية الشراء.


ووفقا لشركة “مايكروسوفت”، فإن تطوير هذا النموذج يتطلب أربع مراحل رئيسية، وهي التدريب على تخطيط المهام وتقسيم المهمة إلى خطوات منطقية، والتعلم من نماذج متقدمة (مثل GPT-4o) لتحويل الخطط إلى أفعال، والاستكشاف الذاتي، الذي يتيح للنموذج البحث عن حلول جديدة وتجاوز العقبات التي تعجز عنها النماذج الأخرى، بالإضافة إلى التدريب المستند إلى المكافآت لتحسين دقة التنفيذ.


وتمت تجربة هذا النموذج الجديد في بيئة اختبار خاصة ببرنامج تحرير النصوص “وورد”. وقد نجح في تنفيذ المهام بنسبة قدرها 71 في المائة، متفوقا على “GPT-4o” الذي حقق نسبة نجاح بلغت 63 في المائة دون معلومات بصرية، كما كان نموذج “LAM” أسرع، إذ استغرق 30 ثانية فقط لتنفيذ المهمة.


ووفقا لصحيفة “هسبريس” التي نقلت الخبر، فإن “LAM” يشكل تقدما كبيرا في مجال الذكاء الاصطناعي، وقد يمهد الطريق لتطوير ذكاء اصطناعي عام (AGI)، فبدلا من الأنظمة التي تقتصر على فهم النصوص وإنتاجها، قد توفر الشركات قريبا مساعدين رقميين يساعدون فعليا في تنفيذ المهام اليومية بنحو فعال.

آماج الإخباریة


على عكس النماذج اللغوية التقليدية مثل GPT-4، التي تركز على معالجة وإنشاء النصوص، يتمتع LAM بالقدرة على تحويل الأوامر النصية إلى أفعال فعلية. على سبيل المثال، إذا طلب المستخدم شراء منتج عبر الإنترنت، يمكن لـ LAM تنفيذ عملية الشراء مباشرة من خلال التفاعل مع واجهة الموقع، بدلاً من تقديم إرشادات نصية فقط.

  1. تخطيط المهام: تدريب النموذج على تقسيم المهام إلى خطوات منطقية.
  2. التعلم من النماذج المتقدمة: الاستفادة من نماذج مثل GPT-4 لتحويل الخطط إلى أفعال.
  3. الاستكشاف الذاتي: تمكين النموذج من البحث عن حلول جديدة والتغلب على العقبات.
  4. التدريب المستند إلى المكافآت: تحسين دقة التنفيذ من خلال تعزيز السلوكيات الصحيحة.

في الاختبارات، أظهر LAM كفاءة عالية في تنفيذ المهام داخل بيئة برنامج “وورد”، حيث نجح في تنفيذ المهام بنسبة 71% مقارنةً بنسبة 63% لنموذج GPT-4 بدون معلومات بصرية. كما كان LAM أسرع، حيث استغرق 30 ثانية فقط لتنفيذ المهام مقابل 86 ثانية لـ GPT-4.

اماج الإخباریة

رغم التقدم الملحوظ، يواجه LAM بعض التحديات، مثل إمكانية حدوث أخطاء في تنفيذ الأوامر وقضايا تنظيمية تتطلب حلولًا. مع ذلك، يُعتبر LAM خطوة مهمة نحو تطوير مساعدين رقميين قادرين على تنفيذ المهام اليومية بكفاءة وفعالية أكبر في المستقبل القريب.

Exit mobile version