A IA da DeepMind Inventa uma Melhor Maneira de Aprender: Um Avanço em Aprendizagem por Reforço Pesquisadores da DeepMind demonstraram que a inteligência artificial pode descobrir autonomamente algoritmos de aprendizagem por reforço (RL) que superam aqueles meticulosamente elaborados por humanos. Esse avanço desafia o paradigma tradicional onde as regras de RL são projetadas manualmente, abrindo caminho para que as máquinas evoluam suas próprias estratégias de aprendizagem apenas a partir da experiência. A inovação central reside na aprendizagem por reforço meta, uma técnica onde um sistema de IA aprende *como* aprender, baseando-se nas experiências coletivas de múltiplos agentes navegando em ambientes complexos. Em vez de depender de regras predefinidas, a IA refina iterativamente um novo método para atualizar políticas e previsões. Quando testado no benchmark clássico da Atari—um conjunto de videogames usado para avaliar o desempenho de RL—o algoritmo descoberto não apenas superou as regras existentes projetadas por humanos, mas também se destacou em tarefas novas e desafiadoras que nunca havia encontrado durante o treinamento. Não é uma melhoria incremental, é uma mudança conceitual. A IA poderia acelerar o progresso em campos que exigem inteligência adaptativa, desde robótica até descobertas científicas. Ao automatizar o processo de descoberta, poderemos em breve ver sistemas de IA que impulsionam seus próprios avanços, reduzindo a necessidade de intervenção humana e potencialmente levando a uma inteligência artificial mais robusta e generalizável. Artigo: