GPT-5 acaba de ser lanzado. Evaluemos su rendimiento en la consecución de capacidades complejas similares a AGI: - @grok 4 (Pensamiento) supera a @OpenAI GPT-5 (Alto) en ambas pruebas, ARC-AGI-2 (razonamiento complejo) y ARC-AGI-1 (menos exigente). - La superior precisión de Grok 4 viene con costos significativamente más altos por tarea, que oscilan entre $2 y $4. - Las variantes más ligeras de GPT-5 (mini/nano) ofrecen un equilibrio entre rendimiento y costo en estos benchmarks. Por favor, ten en cuenta que la prueba ARC-AGI-3 está actualmente en curso, y los resultados de las pruebas anteriores no implican superioridad del modelo. h/t @arcprize
1.19K