一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

🚨 GROK 4 在複雜推理測試中超越 GPT 5 在最新的 ARC AGI 2 基準測試中，Grok 4 的得分約為 16%，超過了 GPT 5 的 9.9%，但每個任務的成本較高，為 2 到 4 美元，而 GPT 5 為 0.73 美元。該測試測量推理能力而非記憶，Grok 4 在 ARC AGI 1 中也以 68% 領先於 GPT 5 的 65.7%。目前 GPT 5 仍然提供更好的價值。較小的模型版本得分較低，目前正在進行互動式 ARC AGI 3 謎題測試的早期試驗。這次勝利提升了 Grok 4 的地位，但 AI 競賽遠未結束。來源：The Decoder, @minchoi

42.54K