Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 PŘEKONÁVÁ GPT 5 V KOMPLEXNÍM TESTU UVAŽOVÁNÍ
V nejnovějším benchmarku ARC AGI 2 dosáhl Grok 4 přibližně 16 % a porazil 9,9 % GPT 5, ale s vyšší cenou 2 až 4 USD za úkol ve srovnání s 0,73 USD GPT 5.
Test měří uvažování před zapamatováním a Grok 4 také vedl ARC AGI 1 s 68 % před 65,7 % GPT 5. GPT 5 stále nabízí prozatím lepší hodnotu.
Menší modelové verze dosáhly mnohem nižšího skóre a probíhají první zkoušky interaktivního testu hlavolamů ARC AGI 3.
Toto vítězství posílí Groka 4, ale závod s umělou inteligencí zdaleka nekončí.
Zdroj: Dekodér, @minchoi

Před 9 h
Chladný
41,01K
Top
Hodnocení
Oblíbené