Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 PRZEWYŻSZA GPT 5 W TESTACH Złożonego ROZUMOWANIA
W najnowszym teście ARC AGI 2, Grok 4 uzyskał wynik około 16%, przewyższając 9,9% GPT 5, ale przy wyższych kosztach od 2 do 4 dolarów za zadanie w porównaniu do 0,73 dolara GPT 5.
Test mierzy zdolność rozumowania w porównaniu do zapamiętywania, a Grok 4 również prowadził w ARC AGI 1 z wynikiem 68% w porównaniu do 65,7% GPT 5. GPT 5 wciąż oferuje lepszą wartość na razie.
Mniejsze wersje modelu uzyskały znacznie niższe wyniki, a wczesne próby są w toku dla interaktywnego testu łamigłówkowego ARC AGI 3.
To zwycięstwo podnosi Grok 4, ale wyścig AI jest daleki od zakończenia.
Źródło: The Decoder, @minchoi

10 godz. temu
Chłodny
42,55K
Najlepsze
Ranking
Ulubione