enumeró los 6 cambios más importantes del mayor evento de investigación en IA de este año, NeurIPS 2025. nos dice mucho sobre hacia dónde se dirige la IA en 2026: 1. El mecanismo de atención está mejorando bastante. Se está volviendo más selectivo usando técnicas como el gating, la esparsidad y un mejor manejo de contextos largos. En unos 6 meses verás modelos más baratos, inteligentes y eficientes. 2. los modelos de frontera convergen. Ya lo sabíamos un poco, pero de nuevo, los modelos top suenan más parecido. Tu elección del modelo fronterizo importa menos que antes, pero también cualquier sesgo o punto ciego se amplifica en todas partes a la vez. 3. El RL finalmente está escalando para la robótica. Lleva años estancándose. el enfoque de "simplemente seguir escalando" que funcionaba para los LLMs ahora funciona para los agentes. 2026 será el año de grandes avances en sistemas agenticos. 4. Los modelos de difusión no son solo memorizar datos de entrenamiento. Un artículo teórico importante mostró que el entrenamiento por difusión en realidad tiene dos fases: una fase temprana en la que los modelos aprenden a generar muestras de alta calidad, y una fase posterior en la que empiezan a memorizar cosas específicas. Más datos de entrenamiento empujan la fase de memorización y te dan una ventana más larga antes de sobreajustar. 5. el sistema de trabajos académicos está COCINADO (en serio). con 20.000 envíos, NeurIPS está ahogado en artículos. incluso están experimentando con IA para revisar artículos generados por IA. Eso significa que ya no se puede confiar realmente en el prestigio de las conferencias y publicaciones. Debes fiarte de quién escribió el artículo y de su trayectoria. 6. Los grandes laboratorios están apostando por completo al razonamiento, la eficiencia y la integración. La raza Frontier ya no se trata solo del tamaño del modelo. Bug Labs está trabajando ahora en: (1) razonamiento como métrica medible, pensamiento paso a paso, llamadas a herramientas, uso en búsquedas (2) eficiencia, ejecutando modelos potentes en teléfonos y dispositivos edge con baja latencia (3) integración de flujos de trabajo, incorporando modelos a herramientas y protocolos como MCP. De verdad te recomiendo que veas este análisis de 10 minutos si la investigación en IA te preocupa.