Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 SUPERÓ A GPT 5 EN UNA PRUEBA DE RAZONAMIENTO COMPLEJO
En el último benchmark ARC AGI 2, Grok 4 obtuvo aproximadamente un 16%, superando el 9.9% de GPT 5, pero a un costo más alto de $2 a $4 por tarea en comparación con los $0.73 de GPT 5.
La prueba mide el razonamiento sobre la memorización, y Grok 4 también lideró el ARC AGI 1 con un 68% frente al 65.7% de GPT 5. GPT 5 sigue ofreciendo un mejor valor por ahora.
Las versiones de modelos más pequeñas obtuvieron puntuaciones mucho más bajas, y se están llevando a cabo pruebas iniciales para la prueba de rompecabezas interactiva ARC AGI 3.
Esta victoria impulsa a Grok 4, pero la carrera de IA está lejos de haber terminado.
Fuente: The Decoder, @minchoi

Hace 17 horas
Fresco
44,27K
Parte superior
Clasificación
Favoritos