Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sementara Kimi k2 Moonshot AI adalah model non-penalaran bobot terbuka terkemuka dalam Indeks Kecerdasan Analisis Buatan, ia menghasilkan ~3x lebih banyak token daripada model non-penalaran lainnya, mengaburkan batas antara penalaran & non-penalaran
Kimi k2 adalah model bobot terbuka utama terbesar - parameter total 1T dengan 32B aktif (ini membutuhkan memori 1TB yang besar pada FP8 asli untuk menahan bobot). Kami memiliki k2 di 57 dalam Indeks Kecerdasan Analisis Buatan, skor mengesankan yang menempatkannya di atas model seperti GPT-4.1 dan DeepSeek V3, tetapi di belakang model penalaran terkemuka.
Sampai sekarang, ada perbedaan yang jelas antara model penalaran dan model non-penalaran dalam eval kami - ditentukan tidak hanya oleh apakah model menggunakan <reasoning> tag, tetapi terutama oleh penggunaan token. Jumlah rata-rata token yang digunakan untuk menjawab semua eval dalam Indeks Kecerdasan Analisis Buatan adalah ~10x lebih tinggi untuk model penalaran daripada untuk model non-penalaran.
Kimi k2 @Kimi_Moonshot menggunakan ~3x jumlah token yang digunakan model non-penalaran median. Penggunaan tokennya hanya hingga 30% lebih rendah dari Claude 4 Sonnet dan Opus ketika dijalankan dalam mode pemikiran yang diperluas anggaran maksimum, dan hampir tiga kali lipat penggunaan token Claude 4 Sonnet dan Opus dengan penalaran dimatikan.
Oleh karena itu, kami merekomendasikan agar Kimi k2 dibandingkan dengan Claude 4 Sonnet dan Opus dalam mode berpikir yang diperluas anggaran maksimum mereka, bukan dengan skor non-penalaran untuk model Claude 4.
Kimi k2 tersedia di API pihak pertama @Kimi_Moonshot serta @FireworksAI_HQ, @togethercompute, @novita_labs, dan @parasail_io.
Lihat di bawah dan di Analisis Buatan untuk analisis 👇 lebih lanjut



60,42K
Teratas
Peringkat
Favorit