Fornitori Kimi K2: Groq sta servendo Kimi K2 a >400 token di output/s, 40 volte più veloce dell'API di prima parte di Moonshot. Congratulazioni a diversi fornitori per essere stati rapidi nel lanciare API per Kimi K2, tra cui @GroqInc, @basetenco, @togethercompute, @FireworksAI_HQ, @parasail_io, @novita_labs, @DeepInfra e ovviamente @Kimi_Moonshot. Questo è impressionante considerando le dimensioni del modello con 1 trilione di parametri totali. Groq si distingue per la velocità fulminea. DeepInfra, Novita e Baseten si distinguono per i loro prezzi, essendo gli unici fornitori a offrire prezzi simili o più economici rispetto all'API di prima parte di Moonshot. Vedi di seguito ulteriori confronti tra i fornitori. Ci aspettiamo rapidi aumenti di velocità tra alcuni fornitori mentre i team ottimizzano per il modello K2 - i nostri numeri qui sotto mostrano le velocità medie delle ultime 72 ore, ma stiamo già vedendo DeepInfra salire a 62 token/s nelle misurazioni di oggi.
52,08K