Mientras que Kimi k2 de Moonshot AI es el modelo no razonador de pesos abiertos líder en el Índice de Inteligencia de Análisis Artificial, produce ~3 veces más tokens que otros modelos no razonadores, difuminando las líneas entre razonamiento y no razonamiento. Kimi k2 es el modelo de pesos abiertos más grande hasta ahora - 1T de parámetros totales con 32B activos (esto requiere una enorme memoria de 1TB en FP8 nativo para mantener los pesos). Tenemos a k2 en el puesto 57 en el Índice de Inteligencia de Análisis Artificial, una puntuación impresionante que lo coloca por encima de modelos como GPT-4.1 y DeepSeek V3, pero detrás de los modelos de razonamiento líderes. Hasta ahora, ha habido una clara distinción entre modelos de razonamiento y modelos no razonadores en nuestras evaluaciones - definida no solo por si el modelo utiliza etiquetas <reasoning>, sino principalmente por el uso de tokens. El número medio de tokens utilizados para responder a todas las evaluaciones en el Índice de Inteligencia de Análisis Artificial es ~10 veces mayor para los modelos de razonamiento que para los modelos no razonadores. El Kimi k2 de @Kimi_Moonshot utiliza ~3 veces el número de tokens que utiliza el modelo no razonador medio. Su uso de tokens es solo hasta un 30% menor que Claude 4 Sonnet y Opus cuando se ejecutan en su modo de pensamiento extendido de presupuesto máximo, y es casi el triple del uso de tokens de ambos, Claude 4 Sonnet y Opus, con el razonamiento desactivado. Por lo tanto, recomendamos que Kimi k2 se compare con Claude 4 Sonnet y Opus en sus modos de pensamiento extendido de presupuesto máximo, no con las puntuaciones no razonadoras para los modelos Claude 4. Kimi k2 está disponible en la API de primera parte de @Kimi_Moonshot, así como en @FireworksAI_HQ, @togethercompute, @novita_labs y @parasail_io. Vea a continuación y en Artificial Analysis para un análisis más detallado 👇
60,42K