🌶️SPICE:在语料环境中的自我游戏🌶️ 📝: - 挑战者基于*语料库*创建任务 - 推理者解决这些任务 - 两者一起训练 ⚔️ -> 自动课程! 🔥 超越标准(无基础)自我游戏 基础修正了幻觉和缺乏多样性 🧵1/6