Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 OVERTREFT GPT 5 OP COMPLEXE REDENERINGSTEST
In de nieuwste ARC AGI 2 benchmark scoorde Grok 4 ongeveer 16%, wat beter is dan GPT 5's 9,9%, maar tegen een hogere prijs van $2 tot $4 per taak in vergelijking met GPT 5's $0,73.
De test meet redenering boven memorisatie, en Grok 4 leidde ook ARC AGI 1 met 68% tegen GPT 5's 65,7%. GPT 5 biedt voorlopig nog steeds betere waarde.
Kleinere modelversies scoorden veel lager, en vroege proeven zijn aan de gang voor de interactieve ARC AGI 3 puzzeltest.
Deze overwinning geeft Grok 4 een boost, maar de AI-race is verre van voorbij.
Bron: The Decoder, @minchoi

15 uur geleden
Koel
44,27K
Boven
Positie
Favorieten