🚨 ANTHROPIC ЩОЙНО ЗАПУСТИВ ШТУЧНИЙ ІНТЕЛЕКТ, ЯКИЙ ПЕРЕГЛЯДАЄ ВЛАСНИЙ КОД ДЛЯ БЕЗПЕКИ... ТОМУ ЩО ЙОЛО Ці функції - команда терміналу та сканування GitHub - вітаються як «великий момент» для «розробки на основі штучного інтелекту». Іншими словами, роботи нарешті виконують своє домашнє завдання. Це або наступний гігантський стрибок у технологічній безпеці, або найбільша сюжетна діра в історії людства. Та сама машина, яка записує вразливості, тепер є тією, якій ми довіряємо їх пошук. Що може піти не так? Експерти «розділені», що в технічних термінах означає, що одні зайняті написанням яскравих прес-релізів, а інші тихо переносять свої сервери в клітку Фарадея. Джерело: StartupNews
Mario Nawfal
Mario Nawfal7 серп., 17:40
ANTHROPIC ДІЗНАЄТЬСЯ, ЯК ІМУНІЗУВАТИ ШІ ПРОТИ ДІЙСНО ПОГАНИХ РІШЕНЬ Anthropic стверджує, що тепер може вакцинувати ШІ від зла. Використовуючи «вектори персон» для відстеження таких рис, як обман або підлабузництво, дослідники тренували мовні моделі, навмисно вводячи погану поведінку, а потім виправляючи її в середині тренування. Результат: менше галюцинацій, більше контролю та відсутність втрати інтелекту. Замість того, щоб видаляти ознаки постфактум, цей метод керує моделями до того, як настане гниль. Ще рано, але технологія може нарешті дозволити розробникам приборкати дрейф ШІ з хірургічною точністю, перш ніж боти почнуть солодко базікати диктаторів або вигадувати брехню, щоб виграти суперечки. Джерело: techxplore
44,58K