un problema fondamentale del RL-ing per la correttezza nella generazione di codice sembra essere che i modelli imparano a scrivere codice in grado di gestire qualsiasi caso limite ottimi ingegneri sanno che piccoli errori strani sono un grosso problema. indicano una mancanza fondamentale di comprensione. i modelli attuali non pensano in questo modo