这一直都是错误的——但在可验证领域的RL时代,这种错误是绝对的。 模型是追求真理的,甚至通过工具使用与一个严酷的外部世界互动。
David Deutsch
David Deutsch8月4日 16:23
大型语言模型(LLMs)被训练来模仿语言的模式,而不是发现或验证真相。因此,当被要求在一个被认为的专家普遍存在误解的领域中以专家的身份发言时,LLM会重复这种误解,采用专家的语气和词汇。
644.34K