Kimi K2 提供商:Groq 的输出速度超过 400 个 token/s,比 Moonshot 的第一方 API 快 40 倍。 祝贺多家提供商迅速推出 Kimi K2 的 API,包括 @GroqInc、@basetenco、@togethercompute、@FireworksAI_HQ、@parasail_io、@novita_labs、@DeepInfra,以及当然还有 @Kimi_Moonshot。考虑到模型的规模达到 1 万亿个参数,这实在令人印象深刻。 Groq 以其超快的速度脱颖而出。DeepInfra、Novita 和 Baseten 以其定价而突出,成为唯一与 Moonshot 的第一方 API 定价相似或更便宜的提供商。 请参见下面对各提供商的进一步比较。我们预计随着团队对 K2 模型的优化,一些提供商的速度将迅速提升——我们下面的数字显示了过去 72 小时的中位速度,但我们已经看到 DeepInfra 在今天的测量中跃升至 62 tokens/s。
52.08K