Alle reden über RL-Umgebungen. Und du hast jetzt zu viel Angst zu fragen: "Was ist eine RL-Umgebung"? Denk daran wie an eine Welt, in der ein Agent lebt, in der der aktuelle Zustand, die Belohnungen und das Ziel definiert sind. Eine neue Möglichkeit, Intelligenz zu skalieren. Der schwierigste Teil bei der Definition von RL-Umgebungen ist es, den Kontext und die Aktionen sinnvoll zu gestalten. Für die meisten Praktiker wird es, wie bei jeder neuen Technologie, nicht so sein. Die Definition des Beobachtungs-/Aktionsraums + der Belohnungsfunktion ist völlig eine Datenangelegenheit... 👀