🚨 GROK 4 PŘEKONÁVÁ GPT 5 V KOMPLEXNÍM TESTU UVAŽOVÁNÍ V nejnovějším benchmarku ARC AGI 2 dosáhl Grok 4 přibližně 16 % a porazil 9,9 % GPT 5, ale s vyšší cenou 2 až 4 USD za úkol ve srovnání s 0,73 USD GPT 5. Test měří uvažování před zapamatováním a Grok 4 také vedl ARC AGI 1 s 68 % před 65,7 % GPT 5. GPT 5 stále nabízí prozatím lepší hodnotu. Menší modelové verze dosáhly mnohem nižšího skóre a probíhají první zkoušky interaktivního testu hlavolamů ARC AGI 3. Toto vítězství posílí Groka 4, ale závod s umělou inteligencí zdaleka nekončí. Zdroj: Dekodér, @minchoi
41,01K