Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 vient d'être lancé. Évaluons ses performances dans l'atteinte de capacités complexes semblables à l'AGI :
- @grok 4 (Pensée) surpasse @OpenAI GPT-5 (Élevé) dans les tests ARC-AGI-2 (raisonnement complexe) et ARC-AGI-1 (moins exigeant).
- La précision supérieure de Grok 4 s'accompagne de coûts par tâche significativement plus élevés, allant de 2 à 4 $.
- Les variantes plus légères de GPT-5 (mini/nano) offrent un compromis équilibré entre performance et coût sur ces benchmarks.
Veuillez noter que le test ARC-AGI-3 est actuellement en cours, et les résultats des tests ci-dessus n'impliquent pas de supériorité du modèle.
h/t @arcprize

1,13K
Meilleurs
Classement
Favoris