Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
AI de la DeepMind inventează o modalitate mai bună de a învăța: o descoperire în învățarea prin întărire
Cercetătorii de la DeepMind au demonstrat că inteligența artificială poate descoperi în mod autonom algoritmi de învățare prin întărire (RL) care îi depășesc pe cei meticulos creați de oameni.
Acest progres provoacă paradigma tradițională în care regulile RL sunt proiectate manual, deschizând calea pentru ca mașinile să-și dezvolte propriile strategii de învățare doar din experiență.
Inovația de bază constă în învățarea prin meta-întărire, o tehnică în care un sistem AI învață *cum* să învețe bazându-se pe experiențele colective ale mai multor agenți care navighează în medii complexe.
În loc să se bazeze pe reguli predefinite, AI rafinează iterativ o nouă metodă de actualizare a politicilor și predicțiilor. Când a fost testat pe benchmark-ul clasic Atari - o suită de jocuri video folosite pentru a evalua performanța RL - algoritmul descoperit nu numai că a depășit regulile existente concepute de om, dar a excelat și în sarcini complet noi și provocatoare pe care nu le-a întâlnit niciodată în timpul antrenamentului.
Nu este o îmbunătățire incrementală, este o schimbare conceptuală. AI ar putea accelera progresul în domenii care necesită inteligență adaptivă, de la robotică la descoperiri științifice.
Prin automatizarea procesului de descoperire, am putea vedea în curând sisteme AI care își lansează propriile progrese, reducând nevoia de intervenție umană și potențial conducând la o inteligență artificială mai robustă și mai generalizabilă.
Hârtie:

Limită superioară
Clasament
Favorite

