Tinh chỉnh LoRA Qwen3 4B trên DGX spark với mlx / mlx-lm. Đạt tốc độ rất đáng nể ~1200 tok/giây.