内発的 AI の動機付けと外発的 AI の動機に関する議論は決着しました。 メタは、明示的な報酬システム全体が気を散らすものであることを示しただけです。 月額 500 ドルの RL プラットフォームは、補助輪を備えたエージェントを教育するようになりました。 本当の学習は、恣意的なスコアではなく、直接的な結果から起こります。 これにより、真に適応性のあるプログラムされていない知能への道が開かれます。