🚨 ANTHROPIC TOCMAI A LANSAT O INTELIGENȚĂ ARTIFICIALĂ CARE ÎȘI REVIZUIEȘTE PROPRIUL COD PENTRU SECURITATE... PENTRU YOLO Funcțiile - o comandă de terminal și scanarea GitHub - sunt salutate ca fiind "marele moment" pentru "dezvoltarea nativă AI". Cu alte cuvinte, roboții își fac în sfârșit temele. Acesta este fie următorul salt uriaș în securitatea tehnologică, fie cea mai mare gaură din istoria omenirii. Aceeași mașină care scrie vulnerabilitățile este acum cea în care avem încredere că le va găsi. Ce ar putea merge prost? Experții sunt "împărțiți", ceea ce înseamnă că unii sunt ocupați să scrie comunicate de presă strălucitoare, în timp ce alții își mută în liniște serverele într-o cușcă Faraday. Sursa: StartupNews
Mario Nawfal
Mario Nawfal7 aug., 17:40
ANTHROPIC DESCOPERĂ CUM SĂ IMUNIZEZE AI ÎMPOTRIVA DECIZIILOR CU ADEVĂRAT PROASTE Anthropic susține că acum poate vaccina AI împotriva răului. Folosind "vectori de persona" pentru a urmări trăsături precum înșelăciunea sau adulatoria, cercetătorii au antrenat modele de limbaj injectând în mod deliberat un comportament rău, apoi corectându-l în mijlocul antrenamentului. Rezultatul: mai puține halucinații, mai mult control și nicio pierdere de inteligență. În loc să frece trăsăturile după fapt, această metodă direcționează modelele înainte de a se instala putregaiul. Este devreme, dar tehnologia ar putea permite în sfârșit dezvoltatorilor să reducă deriva AI cu precizie chirurgicală înainte ca roboții să înceapă să vorbească dulce cu dictatorii sau să inventeze minciuni pentru a câștiga argumente. Sursa: techxplore
44,58K