Yeni MLX server_benchmark'ı sürekli toplu üretim için kullanarak MiniMax M2.1'i M3 Ultra'da yerel olarak çalıştırıyorum. 4bit: 1 talep: 48 t/s 32 istek: 220 t/s 🔥 8bit: 1 talep: 36 t/s 32 talep: 150t/s 🔥