🚨 ANTHROPIC HEEFT NET EEN AI GELANCEERD DIE ZIJN EIGEN CODE VOOR VEILIGHEID BEKEKEN... OMDAT YOLO De functies - een terminalcommando en GitHub-scanning - worden geprezen als het "grote moment" voor "AI-native ontwikkeling." Met andere woorden, de robots maken eindelijk hun huiswerk zelf. Dit is ofwel de volgende grote sprong in techbeveiliging of het grootste plotgat in de menselijke geschiedenis. Dezelfde machine die de kwetsbaarheden schrijft, is nu degene die we vertrouwen om ze te vinden. Wat kan er mogelijk misgaan? Experts zijn "verdeeld," wat in techtermen betekent dat sommigen druk bezig zijn met het schrijven van lovende persberichten terwijl anderen stilletjes hun servers in een Faraday-kooi verplaatsen. Bron: StartupNews
Mario Nawfal
Mario Nawfal7 aug, 17:40
ANTHROPIC ONTDEKT HOE AI TE IMMUNISEREN TEGEN ECHT SLECHTE BESLISSINGEN Anthropic beweert dat het nu AI kan vaccineren tegen kwaad. Met behulp van "persona vectoren" om eigenschappen zoals bedrog of slijmerigheid te volgen, hebben onderzoekers taalmodellen getraind door opzettelijk slecht gedrag in te voeren en dit vervolgens tijdens de training te corrigeren. Het resultaat: minder hallucinaties, meer controle en geen verlies van intelligentie. In plaats van eigenschappen achteraf te verwijderen, stuurt deze methode modellen voordat de rot zich voordoet. Het is vroeg, maar de technologie kan ontwikkelaars eindelijk in staat stellen om AI-afdwaling met chirurgische precisie te beheersen voordat bots beginnen met zoetpraten tegen dictators of leugens uitvinden om argumenten te winnen. Bron: techxplore
44,58K