L'IA de DeepMind invente une meilleure façon d'apprendre : une percée dans l'apprentissage par renforcement Des chercheurs de DeepMind ont démontré que l'intelligence artificielle peut découvrir de manière autonome des algorithmes d'apprentissage par renforcement (RL) qui surpassent ceux méticuleusement élaborés par les humains. Cette avancée remet en question le paradigme traditionnel où les règles de RL sont conçues manuellement, ouvrant la voie à des machines capables d'évoluer leurs propres stratégies d'apprentissage à partir de l'expérience seule. L'innovation centrale réside dans l'apprentissage par renforcement méta, une technique où un système d'IA apprend *comment* apprendre en s'appuyant sur les expériences collectives de plusieurs agents naviguant dans des environnements complexes. Plutôt que de s'appuyer sur des règles prédéfinies, l'IA affine de manière itérative une nouvelle méthode pour mettre à jour les politiques et les prédictions. Lorsqu'elle a été testée sur le benchmark classique d'Atari—une suite de jeux vidéo utilisée pour évaluer la performance du RL—l'algorithme découvert a non seulement surpassé les règles existantes conçues par des humains, mais a également excellé sur des tâches entièrement nouvelles et difficiles qu'il n'avait jamais rencontrées pendant l'entraînement. Ce n'est pas une amélioration incrémentale, c'est un changement conceptuel. L'IA pourrait accélérer les progrès dans des domaines nécessitant une intelligence adaptative, de la robotique à la découverte scientifique. En automatisant le processus de découverte, nous pourrions bientôt voir des systèmes d'IA qui se propulsent eux-mêmes vers leurs propres avancées, réduisant ainsi le besoin d'intervention humaine et menant potentiellement à une intelligence artificielle plus robuste et généralisable. Article :