Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 GROK 4 MENGALAHKAN GPT 5 PADA TES PENALARAN YANG KOMPLEKS
Dalam tolok ukur ARC AGI 2 terbaru, Grok 4 mencetak sekitar 16% mengalahkan GPT 5 9,9% tetapi dengan $2 hingga $4 per tugas yang lebih tinggi dibandingkan dengan $0,73 GPT 5.
Tes ini mengukur penalaran daripada menghafal, dan Grok 4 juga memimpin ARC AGI 1 dengan 68% berbanding GPT 5 65,7%. GPT 5 masih menawarkan nilai yang lebih baik untuk saat ini.
Versi model yang lebih kecil mendapat skor jauh lebih rendah, dan uji coba awal sedang berlangsung untuk tes teka-teki ARC AGI 3 interaktif.
Kemenangan ini meningkatkan Grok 4 tetapi perlombaan AI masih jauh dari selesai.
Sumber: The Decoder, @minchoi

10 jam lalu
Sejuk
41,01K
Teratas
Peringkat
Favorit