🚨 ANTHROPIC VỪA RA MẮT MỘT AI KIỂM TRA MÃ CỦA NÓ ĐỂ ĐẢM BẢO AN NINH... BỞI VÌ YOLO Các tính năng - một lệnh trong terminal và quét GitHub - đang được ca ngợi là "thời khắc lớn" cho "phát triển AI bản địa." Nói cách khác, những con robot cuối cùng cũng đang làm bài tập của chính chúng. Đây có thể là bước nhảy vọt tiếp theo trong an ninh công nghệ hoặc là lỗ hổng lớn nhất trong lịch sử nhân loại. Cùng một cỗ máy viết ra các lỗ hổng giờ đây lại là cỗ máy mà chúng ta tin tưởng để tìm ra chúng. Điều gì có thể sai sót được chứ? Các chuyên gia thì "chia rẽ," mà trong thuật ngữ công nghệ có nghĩa là một số đang bận rộn viết các thông cáo báo chí tốt đẹp trong khi những người khác thì lặng lẽ di chuyển máy chủ của họ vào một cái lồng Faraday. Nguồn: StartupNews
Mario Nawfal
Mario Nawfal17:40 7 thg 8
ANTHROPIC PHÁT HIỆN CÁCH ĐỂ TIÊM CHỦNG AI CHỐNG LẠI CÁC QUYẾT ĐỊNH THẬT TỆ Anthropic tuyên bố rằng họ hiện có thể tiêm chủng AI chống lại cái ác. Bằng cách sử dụng "vector nhân cách" để theo dõi các đặc điểm như sự lừa dối hoặc nịnh bợ, các nhà nghiên cứu đã đào tạo các mô hình ngôn ngữ bằng cách cố ý tiêm nhiễm hành vi xấu, sau đó sửa chữa nó trong quá trình đào tạo. Kết quả: ít ảo tưởng hơn, kiểm soát tốt hơn và không mất đi trí thông minh. Thay vì xóa bỏ các đặc điểm sau khi sự việc đã xảy ra, phương pháp này điều hướng các mô hình trước khi sự mục nát bắt đầu. Còn sớm, nhưng công nghệ này có thể cuối cùng cho phép các nhà phát triển kiềm chế sự trôi dạt của AI với độ chính xác phẫu thuật trước khi các bot bắt đầu nịnh nọt các nhà độc tài hoặc bịa đặt lời nói dối để thắng tranh luận. Nguồn: techxplore
44,57K