Articles pour : SWE-bench

2 articles

Guides

Test de Mythos et Fable : Dépasser SWE-bench avec le concurrent ouvert de Nvidia

Découvrez comment le nouveau cadre open-source de Nvidia défie la domination de SWE-bench. Apprenez à tester les modèles d'IA avec Mythos...

20 juin 20268 min
Recherche en IA

Est-ce assez agentique ? Évaluer les modèles ouverts sur vos propres outils

Apprenez à évaluer les agents IA open-source pour l'autonomie et l'accomplissement de tâches à l'aide de benchmarks personnalisés. Un guid...

18 juin 20269 min