Základním problémem RL-ingu pro správnost u generování kódu se zdá být to, že modely se učí psát kód, který zvládne jakýkoli okrajový případ Skvělí inženýři vědí, že podivné malé chyby jsou velký problém. Ukazují na zásadní nedostatek porozumění. Současné modely takto neuvažují