Codegen上の正確性を追求するRLの根本的な問題は、モデルがどんなエッジケースにも対応できるコードを書くことを学ぶことのようです。 優れたエンジニアは、小さな奇妙なミスが大きな問題であることを知っています。それは根本的な理解の欠如を示しています。現在のモデルはそうは考えていません