La IA de DeepMind inventa una mejor manera de aprender: un avance en el aprendizaje por refuerzo Investigadores de DeepMind han demostrado que la inteligencia artificial puede descubrir de forma autónoma algoritmos de aprendizaje por refuerzo (RL) que superan a aquellos meticulosamente elaborados por humanos. Este avance desafía el paradigma tradicional donde las reglas de RL son diseñadas manualmente, allanando el camino para que las máquinas evolucionen sus propias estrategias de aprendizaje a partir de la experiencia. La innovación central radica en el aprendizaje por refuerzo meta, una técnica donde un sistema de IA aprende *cómo* aprender al extraer de las experiencias colectivas de múltiples agentes que navegan por entornos complejos. En lugar de depender de reglas predefinidas, la IA refina iterativamente un nuevo método para actualizar políticas y predicciones. Cuando se prueba en el clásico benchmark de Atari—una suite de videojuegos utilizada para evaluar el rendimiento de RL—el algoritmo descubierto no solo superó las reglas diseñadas por humanos existentes, sino que también destacó en tareas completamente nuevas y desafiantes que nunca había encontrado durante el entrenamiento. No es una mejora incremental, es un cambio conceptual. La IA podría acelerar el progreso en campos que requieren inteligencia adaptativa, desde la robótica hasta el descubrimiento científico. Al automatizar el proceso de descubrimiento, podríamos ver pronto sistemas de IA que inician sus propios avances, reduciendo la necesidad de intervención humana y potencialmente llevando a una inteligencia artificial más robusta y generalizable. Artículo: