Ajustarea fină folosind GRPO, explicat vizual: