トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 は複雑な推論テストで GPT 5 を上回っています
最新の ARC AGI 2 ベンチマークでは、Grok 4 のスコアは約 16% で、GPT 5 の 9.9% を上回りましたが、GPT 5 の 0.73 ドルと比較して、タスクあたり 2 ドルから 4 ドル高くなっています。
このテストでは暗記よりも推論が測定されており、Grok 4 も ARC AGI 1 を 68% で GPT 5 の 65.7% でリードしました。今のところ、GPT 5 の方が優れた価値を提供します。
小型モデル バージョンのスコアははるかに低く、インタラクティブな ARC AGI 3 パズル テストの初期試験が進行中です。
この勝利により Grok 4 は後押しされますが、AI レースはまだ終わっていません。
出典:デコーダー、@minchoi

10時間前
涼しい
42.54K
トップ
ランキング
お気に入り