Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 ANTHROPIC TOCMAI A LANSAT O INTELIGENȚĂ ARTIFICIALĂ CARE ÎȘI REVIZUIEȘTE PROPRIUL COD PENTRU SECURITATE... PENTRU YOLO
Funcțiile - o comandă de terminal și scanarea GitHub - sunt salutate ca fiind "marele moment" pentru "dezvoltarea nativă AI".
Cu alte cuvinte, roboții își fac în sfârșit temele.
Acesta este fie următorul salt uriaș în securitatea tehnologică, fie cea mai mare gaură din istoria omenirii.
Aceeași mașină care scrie vulnerabilitățile este acum cea în care avem încredere că le va găsi.
Ce ar putea merge prost?
Experții sunt "împărțiți", ceea ce înseamnă că unii sunt ocupați să scrie comunicate de presă strălucitoare, în timp ce alții își mută în liniște serverele într-o cușcă Faraday.
Sursa: StartupNews


7 aug., 17:40
ANTHROPIC DESCOPERĂ CUM SĂ IMUNIZEZE AI ÎMPOTRIVA DECIZIILOR CU ADEVĂRAT PROASTE
Anthropic susține că acum poate vaccina AI împotriva răului.
Folosind "vectori de persona" pentru a urmări trăsături precum înșelăciunea sau adulatoria, cercetătorii au antrenat modele de limbaj injectând în mod deliberat un comportament rău, apoi corectându-l în mijlocul antrenamentului.
Rezultatul: mai puține halucinații, mai mult control și nicio pierdere de inteligență.
În loc să frece trăsăturile după fapt, această metodă direcționează modelele înainte de a se instala putregaiul.
Este devreme, dar tehnologia ar putea permite în sfârșit dezvoltatorilor să reducă deriva AI cu precizie chirurgicală înainte ca roboții să înceapă să vorbească dulce cu dictatorii sau să inventeze minciuni pentru a câștiga argumente.
Sursa: techxplore

44,58K
Limită superioară
Clasament
Favorite