🚨 GROK 4 ПЕРЕВЕРШУЄ GPT 5 У ТЕСТІ НА СКЛАДНЕ МІРКУВАННЯ В останньому бенчмарку ARC AGI 2 Grok 4 набрав близько 16%, перевершивши 9,9% GPT 5, але з вищим показником від 2 до 4 доларів за завдання порівняно з 0,73 долара у GPT 5. Тест вимірює міркування, а не запам'ятовування, і Grok 4 також лідирував у ARC AGI 1 з 68% проти 65,7% у GPT 5. GPT 5 поки що пропонує кращу цінність. Версії менших моделей отримали набагато нижчі бали, і зараз тривають ранні випробування інтерактивного тесту головоломки ARC AGI 3. Ця перемога дає поштовх Grok 4, але гонка штучного інтелекту ще далека від завершення. Джерело: The Decoder, @minchoi
42,54K