強化学習の面白い点の1つは、基礎となる学習アプローチが非常に強力であるため、重要な要素が壊れてもとにかく機能する傾向があるため、バグを見つけるのが難しいことです。