bagian yang gila adalah bahwa Opus 4.1 non-berpikir hampir sama baiknya dengan GPT-5-tinggi, terkadang lebih baik dalam beberapa aspek, kecuali mulai menjawab secara instan daripada berpikir selama satu menit penuh. Saya tidak mengerti bagaimana Anthropic berhasil membuat versi non-penalaran begitu cerdas
lmarena.ai
lmarena.ai12 Agu, 00.57
🚨 Pembaruan Papan Peringkat: Claude Opus 4.1 naik ke #2 secara keseluruhan di Arena dan sekarang menjadi model non-berpikir terbaik, menyamai GPT-5 di #1 di seluruh kategori utama: -Coding - Instruksi Mengikuti - Perintah Keras - Kueri yang Lebih Panjang Selamat untuk @AnthropicAI atas tonggak sejarah yang mengesankan ini!
138,31K