شروحات
اختبار الميثوس والفابل: تجاوز معيار SWE-bench مع المنافس المفتوح من إنفيديا
استكشف كيف يتحدى إطار العمل الجديد مفتوح المصدر من إنفيديا هيمنة SWE-bench. تعلم كيفية اختبار نماذج الذكاء الاصطناعي باستخدام Mythos وFabl...
20 يونيو 20268 دقائق
2 مقال
استكشف كيف يتحدى إطار العمل الجديد مفتوح المصدر من إنفيديا هيمنة SWE-bench. تعلم كيفية اختبار نماذج الذكاء الاصطناعي باستخدام Mythos وFabl...
تعلم كيفية تقييم وكلاء الذكاء الاصطناعي مفتوحة المصدر من حيث الاستقلالية وإنجاز المهام باستخدام معايير قياس مخصصة. دليل عملي للباحثين والم...