DeepMinds AI finner opp en bedre måte å lære på: Et gjennombrudd innen forsterkende læring Forskere ved DeepMind har vist at kunstig intelligens autonomt kan oppdage algoritmer for forsterkende læring (RL) som overgår de som er omhyggelig utformet av mennesker. Dette fremskrittet utfordrer det tradisjonelle paradigmet der RL-regler er manuelt utformet, og baner vei for maskiner til å utvikle sine egne læringsstrategier fra erfaring alene. Kjerneinnovasjonen ligger i metaforsterkende læring, en teknikk der et AI-system lærer *hvordan* å lære ved å trekke fra de kollektive erfaringene til flere agenter som navigerer i komplekse miljøer. I stedet for å stole på forhåndsdefinerte regler, foredler AI iterativt en ny metode for oppdatering av policyer og prediksjoner. Da den ble testet på den klassiske Atari-referansen – en pakke med videospill som brukes til å evaluere RL-ytelse – overgikk den oppdagede algoritmen ikke bare eksisterende menneskedesignede regler, men utmerket seg også på helt nye, utfordrende oppgaver den aldri hadde møtt under trening. Ikke en inkrementell forbedring, det er et konseptuelt skifte. AI kan akselerere fremgang på felt som krever adaptiv intelligens, fra robotikk til vitenskapelige oppdagelser. Ved å automatisere oppdagelsesprosessen kan vi snart se AI-systemer som starter opp sine egne fremskritt, reduserer behovet for menneskelig inngripen og potensielt fører til mer robust og generaliserbar kunstig intelligens. Papir: