Mentre Kimi k2 di Moonshot AI è il principale modello non di ragionamento con pesi aperti nell'Artificial Analysis Intelligence Index, produce circa 3 volte più token rispetto ad altri modelli non di ragionamento, sfumando i confini tra ragionamento e non ragionamento. Kimi k2 è il più grande modello con pesi aperti finora - 1T di parametri totali con 32B attivi (questo richiede un'enorme memoria di 1TB a FP8 nativo per contenere i pesi). Abbiamo k2 al 57° posto nell'Artificial Analysis Intelligence Index, un punteggio impressionante che lo colloca sopra modelli come GPT-4.1 e DeepSeek V3, ma dietro ai principali modelli di ragionamento. Fino ad ora, c'è stata una chiara distinzione tra modelli di ragionamento e modelli non di ragionamento nelle nostre valutazioni - definita non solo dal fatto che il modello utilizzi i tag <reasoning>, ma principalmente dall'uso dei token. Il numero mediano di token utilizzati per rispondere a tutte le valutazioni nell'Artificial Analysis Intelligence Index è circa 10 volte superiore per i modelli di ragionamento rispetto ai modelli non di ragionamento. Il Kimi k2 di @Kimi_Moonshot utilizza circa 3 volte il numero di token che utilizza il modello non di ragionamento mediano. Il suo utilizzo di token è solo fino al 30% inferiore rispetto a Claude 4 Sonnet e Opus quando eseguiti nella loro modalità di pensiero esteso a budget massimo, ed è quasi triplo rispetto all'uso di token di entrambi Claude 4 Sonnet e Opus con il ragionamento disattivato. Pertanto, raccomandiamo che Kimi k2 venga confrontato con Claude 4 Sonnet e Opus nelle loro modalità di pensiero esteso a budget massimo, non con i punteggi non di ragionamento per i modelli Claude 4. Kimi k2 è disponibile sull'API di prima parte di @Kimi_Moonshot così come su @FireworksAI_HQ, @togethercompute, @novita_labs e @parasail_io. Vedi qui sotto e su Artificial Analysis per ulteriori analisi 👇
60,42K