một vấn đề cơ bản của việc RL-ing để đảm bảo tính chính xác trong codegen dường như là các mô hình học cách viết mã có thể xử lý bất kỳ trường hợp biên nào các kỹ sư giỏi biết rằng những lỗi nhỏ lạ lùng là một vấn đề lớn. chúng chỉ ra một sự thiếu hiểu biết cơ bản. các mô hình hiện tại không nghĩ theo cách này