Grok 4 wciąż jest najnowocześniejszy w ARC-AGI-2 wśród modeli granicznych. 15,9% dla Grok 4 w porównaniu do 9,9% dla GPT-5.
ARC Prize
ARC Prize8 sie, 01:29
GPT-5 na ARC-AGI Semi Private Eval GPT-5 * ARC-AGI-1: 65.7%, $0.51/zadanie * ARC-AGI-2: 9.9%, $0.73/zadanie GPT-5 Mini * ARC-AGI-1: 54.3%, $0.12/zadanie * ARC-AGI-2: 4.4%, $0.20/zadanie GPT-5 Nano * ARC-AGI-1: 16.5%, $0.03/zadanie * ARC-AGI-2: 2.5%, $0.03/zadanie
594