Benchmark FrontierMath : Un nouveau défi pour l’IA
Si les benchmarks actuels ont permis de mesurer les progrès fulgurants de l’IA, leur utilité diminue face à des modèles atteignant leurs plafonds. Un nouveau bench, FrontierMath, propose des défis mathématiques d’un tout autre calibre, visant […]