誰もがRL環境について話しています。そして、この時点で「RL環境とは何か」と尋ねるのが怖いですか? エージェントが住んでいて、現在の状態や報酬、目標が定められている世界だと考えればいい。インテリジェンスを拡張する新しい方法。 RL 環境を定義する上で最も難しいのは、コンテキストとアクションを意味のあるものにすることです。ほとんどの開業医にとって、他の新しいテクノロジーと同様に、そうではありません。 観測/行動空間+報酬関数の定義は、完全にデータの問題です...👀
15.91K