Verwendung des neuen MLX server_benchmark für kontinuierliches Batching, um MiniMax M2.1 lokal auf M3 Ultra zu pushen. 4bit: 1 Anfrage: 48 t/s 32 Anfragen: 220 t/s 🔥 8bit: 1 Anfrage: 36 t/s 32 Anfragen: 150t/s 🔥