Menggunakan server_benchmark MLX baru untuk batching berkelanjutan untuk mendorong MiniMax M2.1 secara lokal di M3 Ultra. 4bit: 1 permintaan: 48 t / s 32 permintaan: 220 t/s 🔥 8bit: 1 permintaan: 36 t / s 32 permintaan: 150t/s 🔥