GPT-5 vient d'être lancé. Évaluons ses performances dans l'atteinte de capacités complexes semblables à l'AGI : - @grok 4 (Pensée) surpasse @OpenAI GPT-5 (Élevé) dans les tests ARC-AGI-2 (raisonnement complexe) et ARC-AGI-1 (moins exigeant). - La précision supérieure de Grok 4 s'accompagne de coûts par tâche significativement plus élevés, allant de 2 à 4 $. - Les variantes plus légères de GPT-5 (mini/nano) offrent un compromis équilibré entre performance et coût sur ces benchmarks. Veuillez noter que le test ARC-AGI-3 est actuellement en cours, et les résultats des tests ci-dessus n'impliquent pas de supériorité du modèle. h/t @arcprize
1,13K