這是一個大問題,這在某種程度上是正確的,並且人們尚未更新他們對大型語言模型(LLMs)的思維模式以考慮到這一點。
roon
roon8月6日 05:39
這一直都是錯誤的——但在可驗證領域的RL時代,這種錯誤是絕對的。 模型是追求真理的,甚至通過工具使用與一個嚴酷的外部世界互動。
33.23K