Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mentre Kimi k2 di Moonshot AI è il principale modello non di ragionamento con pesi aperti nell'Artificial Analysis Intelligence Index, produce circa 3 volte più token rispetto ad altri modelli non di ragionamento, sfumando i confini tra ragionamento e non ragionamento.
Kimi k2 è il più grande modello con pesi aperti finora - 1T di parametri totali con 32B attivi (questo richiede un'enorme memoria di 1TB a FP8 nativo per contenere i pesi). Abbiamo k2 al 57° posto nell'Artificial Analysis Intelligence Index, un punteggio impressionante che lo colloca sopra modelli come GPT-4.1 e DeepSeek V3, ma dietro ai principali modelli di ragionamento.
Fino ad ora, c'è stata una chiara distinzione tra modelli di ragionamento e modelli non di ragionamento nelle nostre valutazioni - definita non solo dal fatto che il modello utilizzi i tag <reasoning>, ma principalmente dall'uso dei token. Il numero mediano di token utilizzati per rispondere a tutte le valutazioni nell'Artificial Analysis Intelligence Index è circa 10 volte superiore per i modelli di ragionamento rispetto ai modelli non di ragionamento.
Il Kimi k2 di @Kimi_Moonshot utilizza circa 3 volte il numero di token che utilizza il modello non di ragionamento mediano. Il suo utilizzo di token è solo fino al 30% inferiore rispetto a Claude 4 Sonnet e Opus quando eseguiti nella loro modalità di pensiero esteso a budget massimo, ed è quasi triplo rispetto all'uso di token di entrambi Claude 4 Sonnet e Opus con il ragionamento disattivato.
Pertanto, raccomandiamo che Kimi k2 venga confrontato con Claude 4 Sonnet e Opus nelle loro modalità di pensiero esteso a budget massimo, non con i punteggi non di ragionamento per i modelli Claude 4.
Kimi k2 è disponibile sull'API di prima parte di @Kimi_Moonshot così come su @FireworksAI_HQ, @togethercompute, @novita_labs e @parasail_io.
Vedi qui sotto e su Artificial Analysis per ulteriori analisi 👇



60,42K
Principali
Ranking
Preferiti