Ajustement fin utilisant GRPO, expliqué visuellement :