Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 OVERGÅR GPT 5 PÅ KOMPLEKS RESONNERINGSTEST
I den siste ARC AGI 2-referansen scoret Grok 4 omtrent 16 % og slo GPT 5s 9,9 %, men til en høyere $2 til $4 per oppgave sammenlignet med GPT 5s $0,73.
Testen måler resonnement fremfor memorering, og Grok 4 ledet også ARC AGI 1 med 68 % mot GPT 5s 65.7 %. GPT 5 gir fortsatt bedre verdi foreløpig.
Mindre modellversjoner scoret mye lavere, og tidlige forsøk er i gang for den interaktive ARC AGI 3-puslespilltesten.
Denne seieren øker Grok 4, men AI-løpet er langt fra over.
Kilde: Dekoderen, @minchoi

5 timer siden
Kjølig
37,84K
Topp
Rangering
Favoritter