Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 SURPASSE GPT 5 DANS UN TEST DE RAISONNEMENT COMPLEXE
Dans le dernier benchmark ARC AGI 2, Grok 4 a obtenu environ 16 %, battant le 9,9 % de GPT 5, mais à un coût plus élevé de 2 $ à 4 $ par tâche comparé à 0,73 $ de GPT 5.
Le test mesure le raisonnement par rapport à la mémorisation, et Grok 4 a également devancé ARC AGI 1 avec 68 % contre 65,7 % pour GPT 5. GPT 5 offre encore un meilleur rapport qualité-prix pour l'instant.
Les versions de modèles plus petites ont obtenu des scores beaucoup plus bas, et des essais préliminaires sont en cours pour le test de puzzle interactif ARC AGI 3.
Cette victoire renforce Grok 4, mais la course à l'IA est loin d'être terminée.
Source : The Decoder, @minchoi

il y a 10 heures
Refroidir
42,54K
Meilleurs
Classement
Favoris