轉推 @levie: 代理評估是一個全新的遊戲。 目前大多數 AI 評估都在模型的自我封閉世界中運作。這個…