这是一个很重要的事情,这在很大程度上是(大多数情况下?越来越多地?)真实的,而人们并没有更新他们对大型语言模型(LLMs)的思维模型以考虑这一点。
roon
roon8月6日 05:39
这一直都是错误的——但在可验证领域的RL时代,这种错误是绝对的。 模型是追求真理的,甚至通过工具使用与一个严酷的外部世界互动。
33.24K