أبحاث الذكاء الاصطناعيأولمو-إيفال: منصة عمل تقييمية لحلقة تطوير النموذجأولمو-إيفال هو منصة عمل تقييم مصممة للتكامل بسلاسة في حلقة تطوير النماذج، مما يتيح التكرار السريع والقياس المنهجي لأداء نماذج اللغة.12 يونيو 20267 دقائق