Ottimizzazione fine utilizzando GRPO, spiegato visivamente: