Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 acaba de ser lanzado. Evaluemos su rendimiento en la consecución de capacidades complejas similares a AGI:
- @grok 4 (Pensamiento) supera a @OpenAI GPT-5 (Alto) en ambas pruebas, ARC-AGI-2 (razonamiento complejo) y ARC-AGI-1 (menos exigente).
- La superior precisión de Grok 4 viene con costos significativamente más altos por tarea, que oscilan entre $2 y $4.
- Las variantes más ligeras de GPT-5 (mini/nano) ofrecen un equilibrio entre rendimiento y costo en estos benchmarks.
Por favor, ten en cuenta que la prueba ARC-AGI-3 está actualmente en curso, y los resultados de las pruebas anteriores no implican superioridad del modelo.
h/t @arcprize

1.19K
Populares
Ranking
Favoritas