Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 ПЕРЕВЕРШУЄ GPT 5 У ТЕСТІ НА СКЛАДНЕ МІРКУВАННЯ
В останньому бенчмарку ARC AGI 2 Grok 4 набрав близько 16%, перевершивши 9,9% GPT 5, але з вищим показником від 2 до 4 доларів за завдання порівняно з 0,73 долара у GPT 5.
Тест вимірює міркування, а не запам'ятовування, і Grok 4 також лідирував у ARC AGI 1 з 68% проти 65,7% у GPT 5. GPT 5 поки що пропонує кращу цінність.
Версії менших моделей отримали набагато нижчі бали, і зараз тривають ранні випробування інтерактивного тесту головоломки ARC AGI 3.
Ця перемога дає поштовх Grok 4, але гонка штучного інтелекту ще далека від завершення.
Джерело: The Decoder, @minchoi

10 годин тому
Прохолодно
42,54K
Найкращі
Рейтинг
Вибране