GPT-5 è stato appena rilasciato. Valutiamo le sue prestazioni nel raggiungere capacità complesse simili all'AGI: - @grok 4 (Pensiero) supera @OpenAI GPT-5 (Alto) sia nei test ARC-AGI-2 (ragionamento complesso) che ARC-AGI-1 (meno impegnativi). - L'accuratezza superiore di Grok 4 comporta costi significativamente più elevati per compito, che variano da $2 a $4. - Le varianti più leggere di GPT-5 (mini/nano) offrono un compromesso equilibrato tra prestazioni e costi su questi benchmark. Si prega di notare che il test ARC-AGI-3 è attualmente in corso e i risultati dei test sopra non implicano superiorità del modello. h/t @arcprize
1,14K