找到了如何 "撤销" RL 并将 gpt-oss 重新转回基础模型的方法 明天会发布权重 晚安
jack morris
jack morris8月9日 03:21
对OpenAI的新gpt-oss模型的训练数据感到好奇吗?我也是。 所以我从gpt-oss-20b生成了1000万个示例,进行了分析,结果是……相当离奇。 是时候深入探讨了 🧵
192.17K