DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Lloré, SOTA es solo una fachada, para trabajar de verdad hay que depender del "modelo de buey y caballo". El fundador de OpenRouter, Alex Atallah, acaba de publicar un tweet, diciendo que lo que más usa sigue siendo Kimi-K2-0711 (el Kimi-K2-Instruct de julio). Luego están openai-o4-mini-high, Claude-3.7-Sonnet, gpt-oss-120b, openai-o3. La primera vez que lo vi, pensé, ¿esta persona se ha quedado sin internet, hace tiempo que no usa un nuevo modelo grande? Pero al pensarlo bien, no, no tiene sentido. Esta es la verdadera forma de un Power User, es demasiado real. Si en este momento buscas uno que tenga un contexto suficientemente grande (128K), que sea funcional (SWE-Bench Verified > 65), con una fuerte capacidad de agente (Tau2-bench > 65), un amplio conocimiento (una cantidad de parámetros bastante grande), y que responda rápido (no un modelo de Thinking), parece que solo queda Kimi-K2-Instruct. Así que deduciendo, Alex Atallah debería estar haciendo la mayor parte de su trabajo procesando documentos (contexto largo, especialmente usando 13.4M tokens), utilizando herramientas para analizar y redactar informes (capacidad de agente), todo lo que Kimi-K2-Instruct puede manejar, y luego escribiendo scripts (o4 y Claude-3.7-Sonnet como respaldo, incluso empaquetándolo como un agente para que Kimi-k2 llame a estos modelos para escribir scripts). Finalmente, Kimi-k2 también puede satisfacer el punto más importante, la privacidad de los datos, porque el modelo tiene pesos abiertos, se puede desplegar en su propio servidor, y ninguna información sensible se filtrará a OpenAI o Anthropic. Incluso el GPT-OSS-120B que se menciona abajo debería existir por esta razón. Creo que ahora entiendo por qué los nuevos modelos grandes están compitiendo en capacidad de agente, el uso directo de AI por parte de las personas es solo una etapa intermedia, los usuarios avanzados ya están usando AI para operar AI. Un modelo especializado de agente para enviar y recibir todo el contexto de AI inevitablemente será el más utilizado. Publicación original:

Parte superior

Clasificación

Favoritos