GPT-5 har nettopp blitt utgitt. La oss evaluere ytelsen for å oppnå komplekse AGI-lignende evner: - @grok 4 (Tenkning) overgår @OpenAI GPT-5 (Høy) i både ARC-AGI-2 (kompleks resonnement) og ARC-AGI-1 (mindre krevende) tester. - Grok 4s overlegne nøyaktighet kommer med betydelig høyere kostnader per oppgave, fra $2 til $4. - Lettere GPT-5-varianter (mini/nano) gir en balansert avveining mellom ytelse og kostnad på disse referansene. Vær oppmerksom på at ARC-AGI-3-testen for tiden er i gang, og resultatene av testene ovenfor innebærer ikke modelloverlegenhet. h/t @arcprize
1,14K