Conocemos la capacitación fuera de línea: precapacitación, dpo ... los datos son claros de antemano.
También conocemos la capacitación en línea: ppo, grpo ... Los datos se crean durante el entrenamiento.
Nuevo: Entrenamiento de línea humana: cualquier dato (fuera de línea / en línea) diseñado para coincidir con la percepción humana → puede producir rendimiento en línea a un costo menor