Ora sento alcuni sussurri da parte di fonti che le valutazioni interne stanno dando a gpt5 un leggero vantaggio su grok 4 Heavy. Le valutazioni mostrano solo un lato di un modello, tuttavia, sono curioso di vedere se otterremo miglioramenti significativi in termini di agenticità o altro.
277,1K