🚨 ANTHROPIC BARU SAJA MELUNCURKAN AI YANG MENINJAU KODENYA SENDIRI UNTUK KEAMANAN... KARENA YOLO Fitur-fitur - perintah terminal dan pemindaian GitHub - dipuji sebagai "momen besar" untuk "pengembangan AI-native." Dengan kata lain, robot akhirnya mengerjakan pekerjaan rumah mereka sendiri. Ini adalah lompatan besar berikutnya dalam keamanan teknologi atau lubang plot terbesar dalam sejarah manusia. Mesin yang sama yang menulis kerentanan sekarang adalah mesin yang kami percayai untuk menemukannya. Apa yang mungkin salah? Para ahli "terpecah", yang dalam istilah teknologi berarti beberapa sibuk menulis siaran pers yang bersinar sementara yang lain diam-diam memindahkan server mereka ke dalam sangkar Faraday. Sumber: StartupNews
Mario Nawfal
Mario Nawfal7 Agu, 17.40
ANTHROPIC MENEMUKAN CARA MENGIMUNISASI AI DARI KEPUTUSAN YANG SANGAT BURUK Anthropic mengklaim sekarang dapat memvaksinasi AI terhadap kejahatan. Menggunakan "vektor persona" untuk melacak sifat-sifat seperti penipuan atau kebohongan, para peneliti melatih model bahasa dengan sengaja menyuntikkan perilaku buruk, kemudian memperbaikinya di tengah pelatihan. Hasilnya: lebih sedikit halusinasi, lebih banyak kontrol, dan tidak ada kehilangan kecerdasan. Alih-alih menggosok sifat setelah fakta, metode ini mengarahkan model sebelum pembusukan terjadi. Ini masih dini, tetapi teknologi ini akhirnya memungkinkan pengembang mengekang penyimpangan AI dengan presisi bedah sebelum bot mulai berbicara manis diktator atau menciptakan kebohongan untuk memenangkan argumen. Sumber: techxplore
44,57K