Mise au point supervisée et de renforcement dans les LLM, clairement expliquée (avec des visuels) :