تخطى إلى المحتوى الرئيسي

جنرال إنتويشن تجمع 2.3 مليار دولار لتدريب وكلاء AI عبر ألعاب الفيديو

فريق جلتش
منذ 3 دقائق0 مشاهدة7 دقائق
جنرال إنتويشن تجمع 2.3 مليار دولار لتدريب وكلاء AI عبر ألعاب الفيديو

جمعت General Intuition مبلغ 320 مليون دولار بتقييم 2.3 مليار لتدريب وكلاء AI عبر ألعاب الفيديو. هذا النهج الفريد يسعى لتمكين AI من التعميم من اللعب إلى العالم الحقيقي والروبوتات.

مقدمة تحليلية

أعلنت شركة "General Intuition" الناشئة، ومقرها نيويورك، عن إغلاق جولة تمويل بقيمة 320 مليون دولار، ما رفع تقييمها إلى 2.3 مليار دولار. هذا الاستثمار الضخم، الذي يؤكد تقارير TechCrunch السابقة، يمثل رهانًا كبيرًا على منهجية الشركة الرائدة في تدريب وكلاء الذكاء الاصطناعي. تتلخص هذه المنهجية في استخدام عوالم ألعاب الفيديو الافتراضية، التي توفر كميات هائلة من البيانات، لتعليم نماذج الذكاء الاصطناعي كيفية فهم العالم الحقيقي والتفاعل معه.

شهدت جولات التمويل السابقة جمع الشركة 134 مليون دولار عند إطلاقها في أكتوبر الماضي، ليصل إجمالي التمويل المعلن عنه إلى 454 مليون دولار. هذا التمويل يركز على رؤية تتمحور حول إنشاء نماذج وكلاء AI يمكنها التعميم بفعالية من المحاكاة إلى التجسيد المادي. فعلى أرض الواقع، أبهرت الشركة الحضور بعرض لروبوت رباعي الأرجل يتحرك بذكاء عبر مكتبها، حيث أوضح Kent Rollins، رئيس المنتجات، أن "الدماغ نفسه الذي يدير الوكيل الذي يلعب اللعبة هو الذي يدير الروبوت". ما يثير الدهشة أكثر هو أن هذا الروبوت احتاج إلى 8 دقائق فقط من بيانات الروبوتات في العالم الحقيقي لضبط نموذج الذكاء الاصطناعي الخاص به، بعد أن تم جمع تلك البيانات في الشارع وليس داخل المكتب.

هذه القدرة الفريدة على التعميم من بيئات الألعاب المعقدة إلى التحديات المادية في العالم الحقيقي هي جوهر مهمة General Intuition، وهي ما أقنع المستثمرين البارزين بجدوى هذا الاستثمار الضخم. إنهم يرون في هذه التقنية مفتاحًا لتطوير جيل جديد من وكلاء الذكاء الاصطناعي القادرين على استكشاف وفهم محيطهم بطريقة غير مسبوقة.

التحليل التقني

العمود الفقري لتقنية General Intuition هو نموذج وكيلها القادر على التعميم من اللعب إلى المحاكاة ثم إلى التجسيد المادي. تعتمد الشركة بشكل كبير على البيانات الفريدة التي توفرها من خلال شركتها الشقيقة، Medal.tv، وهي منصة تسمح للاعبين بتحميل ومشاركة مقاطع ألعاب الفيديو. هذه المقاطع، التي تضم مئات الملايين من ساعات اللعب، لم توفر فقط مجموعة بيانات أولية لتدريب نموذج General Intuition على التفكير المكاني الزماني (spatial-temporal reasoning)، بل الأهم من ذلك، أنها تضمنت "ملصقات الأفعال" (action labels) المدمجة. هذه الملصقات هي سجلات دقيقة للأزرار التي ضغطها اللاعب ومتى، وهو ما يميز منهجية General Intuition عن معظم المنافسين الذين يحاولون استنتاج الأفعال من الفيديو وحده، وهو ما يعتبره الرئيس التنفيذي Pim de Witte غير كافٍ.

يشير Pim de Witte إلى أن هذا النهج يمثل "المرحلة التالية من التدريب المسبق المستقبلي"، مؤكداً أنهم يمتلكون نموذجًا واحدًا يمكنه الاستجابة للمعلومات التي تظهر على شاشة Fortnite واتخاذ إجراءات، بالإضافة إلى التفاعل مع ديناميكيات العالم الحقيقي بطريقة لا يمكن لنموذج لغوي كبير (LLM) تحقيقها. يتكون النموذج من عدة عناصر تقنية رئيسية:

  • بيانات الأفعال المدمجة (Action-labeled data): يتم الحصول عليها من مقاطع Medal.tv، وهي توفر تفصيلاً دقيقًا لإدخالات اللاعبين، مما يساعد النموذج على فهم السببية.
  • نموذج العالم (World model): بيئة محاكاة يتم إنشاؤها إطارًا بإطار، وليست محرك ألعاب تقليدي. يُشار إليها داخليًا باسم "الصالة الرياضية" (the gym)، وهي تستخدم كبيئة تدريب وليست المنتج النهائي.
  • قدرة التعميم (Generalization): النموذج مصمم للانتقال بسلاسة من الأداء في الألعاب الافتراضية إلى التفاعل مع الروبوتات في العالم المادي. على سبيل المثال، تعلم الروبوت رباعي الأرجل التنقل وتجنب العقبات بفضل التدريب الأولي على الألعاب وبضعة دقائق من بيانات العالم الحقيقي.
  • فهم "الذات" و"البيئة": تساعد بيانات الأفعال النموذج على تمييز نفسه عن بيئته، مما يمنحه فهمًا أعمق للسببية والتفاعل مع العالم.

تهدف General Intuition في نهاية المطاف إلى بيع نموذج الوكيل نفسه، مع التركيز على جعل واجهة برمجة التطبيقات (API) الخاصة بها متاحة على نطاق أوسع بحلول نهاية الصيف. لقد أظهرت الشركة مرونة نموذجها من خلال اختباره ليس فقط في الروبوتات رباعية الأرجل، بل أيضًا في الطائرات بدون طيار والأجهزة الأخرى، وحتى في ألعاب القيادة، مما يؤكد أنها "تعمل على أي شيء يمكن التحكم فيه باستخدام وحدة تحكم الألعاب أو لوحة المفاتيح والماوس".

السياق وتأثير السوق

لا شك أن تقنية General Intuition تثير الإعجاب في العروض التوضيحية، لكنها ليست الشركة الوحيدة التي تسعى لحل مشكلة وكلاء الذكاء الاصطناعي القابلين للتعميم. التحدي الأكبر يكمن في جعل مثل هذا النموذج يصمد في العالم المادي على نطاق واسع، وهو أمر لم يتحقق بعد. تتطلب معظم الأساليب كميات هائلة من بيانات العالم الحقيقي التي يتم جمعها ببطء وبتكلفة باهظة. هنا يأتي رهان General Intuition الكبير: أن بيانات اللعب تمثل "اختصارًا قابلاً للتطوير" لهذه المشكلة.

المستثمرون يشاركون الشركة هذا الرهان، فقد قادت شركة Khosla Ventures الجولة الأخيرة، بمشاركة من General Catalyst، جيف بيزوس، إريك شميدت، نيكو روزبرغ، وباحثين من Google DeepMind وMIT. يرى Vinod Khosla، من Khosla Ventures، أن رؤية Pim de Witte وموقف الشركة من البيانات الاحتكارية هما الدافع وراء هذا الاستثمار. ويشبه ما يحدث في نماذج العالم بما حدث في النماذج اللغوية الكبيرة (LLMs) بظهور "القفزة النوعية" في الاستنتاج، متوقعًا "قفزة نوعية" مماثلة في نماذج العالم تتمثل في "ظهور الحدس في الذكاء الاصطناعي، قدرة تشبه الحدس البشري"، والتي يرى أن بيانات الأفعال وردود الأفعال البشرية في الألعاب هي المفتاح لها.

معظم التمويل الجديد سيخصص لتوسيع سعة الحوسبة (compute capacity)، حيث أبرمت General Intuition صفقة مع CoreWeave وتخطط للتركيز على التدريب المسبق (pre-training) للنسخة التالية من النموذج. كما تم تخصيص جزء من التمويل لجعل واجهة برمجة التطبيقات (API) الخاصة بها متاحة على نطاق أوسع بحلول نهاية الصيف. لا ترى الشركة نفسها كهدف للاستحواذ، بل كـ"شركة أجيال" (generational company)، ومُمكّن للنظام البيئي (ecosystem enabler) على غرار Anthropic أو OpenAI، يهدف إلى توفير النموذج الأساسي الذي يمكن للآخرين البناء عليه، بدلاً من تطوير منتجات نهائية مثل السيارات ذاتية القيادة. يؤكد Khosla أن البيانات الاحتكارية للشركة عبر Medal.tv هي ما أوصلها إلى هذا الحد، وقدرتها على الاستمرار في جمع بيانات لا يمتلكها أحد آخر ستكون ضرورية.

إلى جانب الجانب التقني، تتميز General Intuition ببعد أخلاقي قوي. فقد عمل الرئيس التنفيذي Pim de Witte في المجال الإنساني، وهو يضع خطوطًا حمراء واضحة: لن تُستخدم وكلاء الشركة لإلحاق الضرر بالبشر، ولا في "الاستقلالية الفتاكة" (lethal autonomy). يفضل استخدام نماذجهم في مهام البحث والإنقاذ. كما أطلقت الشركة منصة "Nerve" كسوق عمل يمكّن اللاعبين من كسب المال باستخدام إعداداتهم الحالية، بدءًا من تصنيف البيانات وصولاً إلى التشغيل عن بُعد للروبوتات، بهدف إشراك الجيل الأكثر عرضة للتحديات التي تفرضها وظائف AI.

رؤية Glitch4Techs

إن رهان General Intuition على تحويل تجارب ألعاب الفيديو إلى ذكاء اصطناعي عامل في العالم الحقيقي هو بلا شك جريء ومبتكر. من منظور Glitch4Techs، بينما تُظهر العروض التوضيحية إمكانات هائلة، فإن السؤال الأكبر الذي لم يتم الإجابة عليه بعد هو مدى قدرة هذا النقل من المحاكاة إلى العالم الحقيقي على الصمود والتوسع على نطاق واسع. يعتمد نجاح الشركة بشكل حاسم على قدرتها على إثبات أن "الاختصار القابل للتطوير" الذي تقدمه بيانات الألعاب يمكن أن يحل محل الحاجة الضخمة والمكلفة لبيانات العالم الحقيقي في تدريب نماذج الذكاء الاصطناعي المعقدة.

على صعيد التحديات الأمنية والقيود، فإن الالتزام الأخلاقي للشركة بعدم تطوير "استقلالية فتاكة" هو خطوة إيجابية ومرحّب بها في مشهد تقني يتجه نحو تطبيقات عسكرية متزايدة للذكاء الاصطناعي. ومع ذلك، فإن قوة النماذج القادرة على التعميم تحمل دائمًا مخاطر محتملة، ويجب أن تظل هناك رقابة صارمة على كيفية استخدام التقنية من قبل الأطراف الثالثة، خاصة مع نية الشركة جعل واجهة برمجة التطبيقات (API) الخاصة بها متاحة على نطاق واسع. تجميع البيانات عبر منصة Medal.tv ومنصة "Nerve" لخلق "عجلة بيانات تدور ذاتيًا" (data flywheel) يمكن أن يؤدي إلى تحديات في خصوصية البيانات وحوكمتها على المدى الطويل.

بالنظر إلى المستقبل، إذا نجحت General Intuition في تحقيق رؤيتها، فإن تأثيرها سيكون تحويليًا. يمكن لوكلائها القابلين للتعميم أن يسرعوا بشكل كبير من وتيرة الابتكار في مجالات الروبوتات والواقع الافتراضي والمعزز، وقد يقلبون موازين القوى في سباق الذكاء الاصطناعي. إن خططهم لتوسيع سعة الحوسبة وتوفير واجهة برمجة تطبيقات مفتوحة تشير إلى طموح بأن يصبحوا لاعبًا أساسيًا في البنية التحتية لوكلاء الذكاء الاصطناعي، مما يتيح لشركات أخرى بناء تطبيقات متطورة عليها. منصة "Nerve" هي أيضًا نموذج مثير للاهتمام للتخفيف من تأثير إزاحة الوظائف المرتبطة بالذكاء الاصطناعي، وتحويل المستخدمين إلى شركاء فاعلين في دورة البيانات، مما قد يخلق نموذجًا اقتصاديًا جديدًا للعمل في عصر الأتمتة المتقدمة. يبقى أن نرى ما إذا كان "الحدس" الذي تتحدث عنه الشركة سيترجم إلى قدرات فائقة في العالم المادي.

أعجبك المقال؟ شاركه

النشرة البريدية

كن أول من يعرف بمستقبل التقنية

أهم الأخبار والتحليلات التقنية مباشرة في بريدك.