Uuden MLX-server_benchmark:n käyttö jatkuvaan eräajoon MiniMax M2.1:n paikalliseen julkaisuun M3 Ultralla. 4bitti: 1 pyyntö: 48 t/s 32 pyyntöä: 220 t/s 🔥 8bittinen: 1 pyyntö: 36 t/s 32 pyyntöä: 150t/s 🔥