RT @levie: エージェント評価はまったく新しい球技です。 現在、ほとんどの AI 評価は、モデルの自己完結型の世界内で動作しています。このw...