GPT-5 diiklankan sebagai pengurangan halusinasi dan sepertinya berhasil. 99,5 -> 99,9 adalah kesalahan 80% lebih sedikit. Saya tidak tahu mengapa orang tidak membuat masalah yang lebih besar dari ini. Halusinasi adalah salah satu masalah terbesar LLM dan beberapa mengira mereka tidak dapat dipecahkan.
OpenRouter
OpenRouter15 Agu, 00.29
Setelah satu minggu, GPT-5 telah menduduki puncak bagan model milik kami untuk akurasi🥇 pemanggilan alat Di urutan kedua adalah Claude 4.1 Opus, dengan 99,5% Rincian 👇
135,1K