廊下での継続的な学習に関する議論で特に印象に残ったポイント@JeffDean: 1. デプロイ時にユーザーの好みを使ったRL/Finetuningは、エージェントの動作を制御できないため危険です。 2. 事前訓練の新たなパラダイムが必要で、エージェント的継続的な学習を可能にする。 3. Googleは現在の事前学習スケーリング法の鈍化を見ていません。 上記のすべてのポイントは相反するものではありません。見出しを無視するよりも、現場での技術的な議論がもっと必要です。