Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Menangis, SOTA hanyalah wajah, dan Anda harus mengandalkan "model ternak dan kuda" untuk benar-benar bekerja
Alex Atallah, pendiri OpenRouter, baru saja men-tweet bahwa penggunaan terbesarnya adalah Kimi-K2-0711 (Kimi-K2-Instruct pada bulan Juli).
Lalu ada openai-o4-mini-high, claude-3.7-sonnet, gpt-oss-120b, openai-o3
Hal pertama yang saya lihat adalah, apakah orang ini keluar dari Internet, dan dia sudah lama tidak menggunakan model besar baru?
Tetapi jika Anda memikirkannya dengan hati-hati, tidak, itu sangat salah. Itulah penggunaan sebenarnya dari Power User, itu sangat nyata
Jika Anda menemukannya pada saat ini, dengan konteks yang cukup besar (128K), kemampuan yang kuat untuk digunakan (SWE-bench diverifikasi > 65), kemampuan agen yang kuat (Tau2-bench > 65), sejumlah besar pengetahuan (jumlah parameter yang cukup besar), dan jawaban cepat (model non-Berpikir), tampaknya hanya Kimi-K2-Instruct yang tepat.
Mundur, Alex Atallah mungkin melakukan sebagian besar pekerjaannya dengan bekerja dengan dokumen (konteks panjang, terutama dengan 13,4 juta token), menggunakan alat untuk menganalisis dan menulis laporan (kemampuan Agen), yang dapat dilakukan oleh Kimi-K2-Instruct, dan kemudian menulis skrip (o4 dan Claude-3.7-Sonnet menutupi bagian bawah, dan bahkan membungkusnya sebagai agen bagi Kimi-k2 untuk memanggil model-model ini untuk menulis skrip).
Terakhir, Kimi-k2 juga memenuhi poin terpenting, privasi data, karena modelnya berbobot terbuka, dapat digunakan di servernya sendiri, dan informasi sensitif apa pun tidak akan bocor ke OpenAI atau Anthropic. Bahkan GPT-OSS-120B berikut harus berarti di sini.
Saya mungkin dapat mengerti mengapa model besar baru sekarang penuh dengan kemampuan agen, dan penggunaan langsung AI oleh manusia hanya dalam tahap tengah, dan pengguna tingkat lanjut telah menggunakan AI untuk mengoperasikan AI. Model khusus agen yang digunakan untuk mengirim dan menerima semua konteks AI pasti akan menjadi penggunaan teratas.
Benang asli:


Teratas
Peringkat
Favorit
