Тонкая настройка LoRA Qwen3 4B на DGX spark с mlx / mlx-lm. Получает очень достойные ~1200 токенов/сек.