ini selalu salah - tetapi sekarang salah secara kategoris di era RL pada domain yang dapat diverifikasi Model mencari kebenaran dan bahkan berinteraksi dengan dunia luar yang sulit melalui penggunaan alat
David Deutsch
David Deutsch4 Agu, 16.23
LLM dilatih untuk meniru pola bahasa, bukan untuk menemukan atau memverifikasi kebenaran. Jadi, ketika diminta untuk berbicara sebagai ahli di bidang di mana para ahli yang dianggap memiliki kesalahpahaman yang tersebar luas, LLM akan mengulangi kesalahpahaman itu, mengadopsi daftar dan kosakata para ahli.
644,34K