تحقق محركنا لتحويل COBOL إلى Python من 15,552 برنامجًا حقيق…

أعلنت شركة KIVUMIA عن تحقيق إنجاز كبير في مجال تحديث الأنظمة القديمة، حيث تم التحقق من محركها لتحويل COBOL إلى Python بنجاح على 15,552 برنامجًا حقيقيًا. وقد أنتج المحرك 98.78% من مخرجات Python صالحة نحويًا، مؤكدة على كفاءته دون أي تدخل من النماذج اللغوية الكبيرة (LLMs).

لقد تم اختبار المحرك على مجموعة بيانات ضخمة وموثوقة، تضم 15,552 ملف مصدر COBOL ليست مجرد معايير اصطناعية، بل برامج حقيقية تم جمعها من 131 مستودعًا مفتوح المصدر عبر 5 قارات. شملت هذه المصادر بلدانًا مثل النرويج وفرنسا والبرازيل والهند واليابان والولايات المتحدة الأمريكية، ومستودعات مثل GitHub وHuggingFace وCBT Tape وGnuCOBOL ومستودعات IBM العامة. تضمنت البرامج إصدارات COBOL تجارية، وإضافات GnuCOBOL، وTypeCOBOL، ولهجات Mainframe، دون أي تحيز في الاختيار أو عينات منسقة؛ كل ما أمكن العثور عليه تم تضمينه.

أظهرت النتائج تقدمًا ملحوظًا، حيث ارتفعت نسبة البرامج المنتجة لـ Python صالح من 96.84% (14,020 من 14,508 ملفات) في الإصدار السابق (v5.6) إلى 98.78% (15,362 من 15,552 ملفًا) في الإصدار الحالي (v5.8e)، بزيادة صافية قدرها 1,342 ملفًا. تعريف 'Python صالح' في هذا السياق صارم للغاية: نستخدم دالة ast.parse() في Python، والتي توفر تقييمًا ثنائيًا وحتميًا. إذا نجح الكود الناتج في اجتياز ast.parse() دون رفع SyntaxError، فهو يعتبر صالحًا. هذه هي أشد تعريف ممكن للدقة النحوية، ولا يمكن لمراجع بشري أو نموذج ذكاء اصطناعي أن يتجاوزه أو 'يهلوس' طريقه من خلاله.

لا تزال هناك 190 ملفًا تفشل في التحويل، وهي تقع ضمن فئات محددة مثل TypeCOBOL (~60 ملفًا)، وإضافات GnuCOBOL (~40 ملفًا)، وCOBOL غير القياسي (~30 ملفًا)، وبنى STRING/UNSTRING العميقة (~25 ملفًا)، وMainframe الغريبة (~35 ملفًا). هذه ليست أخطاء تحليلية (parsing bugs) بل هي تركيبات تقع عند الحدود الخارجية لما يُتوقع من أي محلل COBOL قياسي التعامل معه، ويعمل الفريق حاليًا على معالجتها. يعمل محرك AGUELLID CODE بشكل مختلف؛ فهو لا يترجم COBOL إلى Python مباشرة، بل يحول COBOL إلى تمثيل وسيط دلالي (semantic intermediate representation) ثم يولد كود Python مكافئًا بشكل مثبت – ليس سطرًا بسطر، بل سلوكًا بسلوك. هذه العملية حتمية (deterministic)، حيث ينتج نفس المدخل نفس المخرج دائمًا، ويمكن تدقيق المخرج وتتبع المنطق، مما يعني عدم وجود 'صندوق أسود'.

يُقدر وجود 220 مليار سطر من COBOL في الإنتاج اليوم، معظمها يعمل على أنظمة لم يعد بإمكان المؤسسات صيانتها، حيث تقاعد المهندسون الذين كتبوها وتوثيقها غير مكتمل. تحديث هذا الكود ليس خيارًا جماليًا بل هو مسألة بقاء لعشرات الصناعات. تتضمن الأساليب الحالية إعادة الكتابة اليدوية (مكلفة، بطيئة، عرضة للأخطاء)، والترجمة بواسطة LLM (غير حتمية، غير قابلة للتدقيق، مخاطر عالية للهلوسة)، والمترجمات السطحية (brittle, shallow) التي تفشل في البنى المعقدة. يتميز AGUELLID CODE بأنه ليس أيًا من هذه، ويقدم حلاً حتميًا وقابلًا للتدقيق بنسبة نجاح 98.78% على 15,552 ملفًا حقيقيًا بدون استخدام LLMs.

ماذا يعني هذا لعملك؟

يُعد هذا الإنجاز تحولًا نوعيًا للمؤسسات التي تعتمد على أنظمة COBOL القديمة. فالقدرة على تحويل هذا الكم الهائل من التعليمات البرمجية بدقة وحتمية وشفافية، دون الاعتماد على النماذج اللغوية الكبيرة التي تفتقر إلى إمكانية التدقيق، توفر مسارًا موثوقًا للتحديث. هذا الأمر حاسم في قطاعات مثل البنوك والتأمين والأنظمة الحكومية، حيث لا يُعد 'النموذج اعتقد أنه صحيح' تفسيرًا مقبولًا. يستمر الفريق في العمل على سد الفجوات المتبقية، ويهدف إلى الوصول إلى نسبة 99.2-99.5% على المجموعة الكاملة من البرامج. هذا التطور يفتح آفاقًا جديدة أمام تحديث البنى التحتية التقنية الحرجة.

تحقق محركنا لتحويل COBOL إلى Python من 15,552 برنامجًا حقيقيًا بنسبة 98.78% من صحة مخرجات Python، بدون أي نماذج لغوية كبيرة.

ماذا يعني هذا لعملك؟

كن أول من يعرف بمستقبل التقنية

مقالات قد تهمك

مايكروسوفت: 3.2 مليار دولار من Anthropic وتراجع OpenAI بـ 600 مليون

إنتل Core 2 Duo: الذكرى العشرون لاستعادة الهيمنة بتقنية 65 نانومتر

وارنر براذرز تقاضي أمازون لـ'صيد موظفين': عقد بيا بارلو حتى 2027

تقييم 20 مليار دولار لـ Boring Company: حقائق ومخاطر