DeepMind's AI uitvindingen een betere manier om te leren: een doorbraak in versterkend leren Onderzoekers van DeepMind hebben aangetoond dat kunstmatige intelligentie autonoom versterkende leer (RL) algoritmes kan ontdekken die beter presteren dan die zorgvuldig door mensen zijn ontwikkeld. Deze vooruitgang daagt het traditionele paradigma uit waarbij RL-regels handmatig worden ontworpen, en opent de weg voor machines om hun eigen leerstrategieën te ontwikkelen op basis van ervaring alleen. De kerninnovatie ligt in meta-versterkend leren, een techniek waarbij een AI-systeem leert *hoe* te leren door gebruik te maken van de collectieve ervaringen van meerdere agenten die complexe omgevingen navigeren. In plaats van te vertrouwen op vooraf gedefinieerde regels, verfijnt de AI iteratief een nieuwe methode voor het bijwerken van beleidslijnen en voorspellingen. Toen het werd getest op de klassieke Atari benchmark—een suite van videogames die wordt gebruikt om de prestaties van RL te evalueren—overtrof het ontdekte algoritme niet alleen de bestaande door mensen ontworpen regels, maar presteerde het ook uitstekend op geheel nieuwe, uitdagende taken die het tijdens de training nog nooit was tegengekomen. Geen incrementele verbetering, het is een conceptuele verschuiving. AI zou de vooruitgang in velden die adaptieve intelligentie vereisen, kunnen versnellen, van robotica tot wetenschappelijke ontdekkingen. Door het ontdekproces te automatiseren, zouden we binnenkort AI-systemen kunnen zien die hun eigen vooruitgang opstarten, waardoor de behoefte aan menselijke tussenkomst vermindert en mogelijk leidt tot robuustere en generaliseerbare kunstmatige intelligentie. Paper: