一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

使用新的 MLX server_benchmark 進行持續批次處理，以在 M3 Ultra 上本地推送 MiniMax M2.1。 4位元： 1 個請求：48 t/s 32 個請求：220 t/s 🔥 8位元： 1 個請求：36 t/s 32 個請求：150t/s 🔥