Dostawcy Kimi K2: Groq obsługuje Kimi K2 z prędkością >400 tokenów/s, 40 razy szybciej niż API pierwszej strony Moonshot. Gratulacje dla wielu dostawców za szybkie uruchomienie API dla Kimi K2, w tym @GroqInc, @basetenco, @togethercompute, @FireworksAI_HQ, @parasail_io, @novita_labs, @DeepInfra, a oczywiście @Kimi_Moonshot. To imponujące, biorąc pod uwagę rozmiar modelu wynoszący 1 bilion parametrów. Groq wyróżnia się błyskawiczną prędkością. DeepInfra, Novita i Baseten wyróżniają się cenami, będąc jedynymi dostawcami, którzy wyceniają podobnie lub taniej niż API pierwszej strony Moonshot. Zobacz poniżej dalsze porównania między dostawcami. Oczekujemy szybkiego wzrostu prędkości u niektórych dostawców, gdy zespoły optymalizują model K2 - nasze dane poniżej pokazują mediany prędkości z ostatnich 72 godzin, ale już widzimy, że DeepInfra skoczył do 62 tokenów/s w dzisiejszych pomiarach.
52,09K