ett grundläggande problem med RL-ing för korrekthet på codegen verkar vara att modeller lär sig skriva kod som kan hantera alla kantfall Skickliga ingenjörer vet att konstiga små fel är en stor grej. De visar på en grundläggande brist på förståelse. Nuvarande modeller tänker inte så här