Finjustering med GRPO, visuelt forklart: