🚨 GROK 4 は複雑な推論テストで GPT 5 を上回っています 最新の ARC AGI 2 ベンチマークでは、Grok 4 のスコアは約 16% で、GPT 5 の 9.9% を上回りましたが、GPT 5 の 0.73 ドルと比較して、タスクあたり 2 ドルから 4 ドル高くなっています。 このテストでは暗記よりも推論が測定されており、Grok 4 も ARC AGI 1 を 68% で GPT 5 の 65.7% でリードしました。今のところ、GPT 5 の方が優れた価値を提供します。 小型モデル バージョンのスコアははるかに低く、インタラクティブな ARC AGI 3 パズル テストの初期試験が進行中です。 この勝利により Grok 4 は後押しされますが、AI レースはまだ終わっていません。 出典:デコーダー、@minchoi
42.54K