Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 ПРЕВОСХОДИТ GPT 5 В СЛОЖНЫХ ТЕСТАХ РАССУЖДЕНИЯ
В последнем бенчмарке ARC AGI 2 Grok 4 набрал около 16%, обойдя GPT 5 с 9.9%, но с более высокой стоимостью от $2 до $4 за задачу по сравнению с $0.73 у GPT 5.
Тест измеряет рассуждение, а не запоминание, и Grok 4 также опередил ARC AGI 1 с 68% против 65.7% у GPT 5. На данный момент GPT 5 все еще предлагает лучшее соотношение цены и качества.
Меньшие версии модели набрали значительно меньше, и в настоящее время проводятся ранние испытания интерактивного теста-головоломки ARC AGI 3.
Эта победа поднимает Grok 4, но гонка ИИ еще далеко не окончена.
Источник: The Decoder, @minchoi

14 часов назад
Классно
44,27K
Топ
Рейтинг
Избранное