GPT-5 wurde gerade veröffentlicht. Lassen Sie uns seine Leistung bei der Erreichung komplexer AGI-ähnlicher Fähigkeiten bewerten: - @grok 4 (Denken) übertrifft @OpenAI GPT-5 (Hoch) sowohl in den Tests ARC-AGI-2 (komplexes Denken) als auch ARC-AGI-1 (weniger anspruchsvoll). - Die überlegene Genauigkeit von Grok 4 geht mit deutlich höheren Kosten pro Aufgabe einher, die zwischen 2 und 4 Dollar liegen. - Leichtere GPT-5-Varianten (mini/nano) bieten einen ausgewogenen Kompromiss zwischen Leistung und Kosten bei diesen Benchmarks. Bitte beachten Sie, dass der Test ARC-AGI-3 derzeit durchgeführt wird und die Ergebnisse der oben genannten Tests keine Modellüberlegenheit implizieren. h/t @arcprize
1,2K