🚨 ANTHROPIC HAR PRECIS LANSERAT EN AI SOM GRANSKAR SIN EGEN KOD FÖR SÄKERHET... EFTERSOM YOLO Funktionerna - ett terminalkommando och GitHub-skanning - hyllas som det "stora ögonblicket" för "AI-native utveckling". Med andra ord gör robotarna äntligen sin egen hemläxa. Detta är antingen nästa stora steg inom teknisk säkerhet eller det enskilt största plot hole i mänsklighetens historia. Samma maskin som skriver sårbarheterna är nu den vi litar på för att hitta dem. Vad skulle kunna gå fel? Experter är "splittrade", vilket i tekniska termer innebär att vissa är upptagna med att skriva lysande pressmeddelanden medan andra i tysthet flyttar in sina servrar i en Faraday-bur. Källa: StartupNews
Mario Nawfal
Mario Nawfal7 aug. 17:40
ANTHROPIC UPPTÄCKER HUR MAN KAN IMMUNISERA AI MOT RIKTIGT DÅLIGA BESLUT Anthropic hävdar att de nu kan vaccinera AI mot ondska. Genom att använda "personavektorer" för att spåra egenskaper som bedrägeri eller smicker, tränade forskare språkmodeller genom att medvetet injicera dåligt beteende och sedan korrigera det mitt i träningen. Resultatet: mindre hallucinationer, mer kontroll och ingen förlust av intelligens. I stället för att skrubba bort egenskaper i efterhand styr den här metoden modellerna innan rötan sätter in. Det är tidigt, men tekniken kan äntligen låta utvecklare bromsa AI-driften med kirurgisk precision innan botar börjar prata söta diktatorer eller hitta på lögner för att vinna argument. Källa: techxplore
44,59K