🚨 ANTHROPIC VIENT DE LANCER UNE IA QUI REVUE SON PROPRE CODE POUR LA SÉCURITÉ... PARCE QUE YOLO Les fonctionnalités - une commande terminale et un scan GitHub - sont saluées comme le "grand moment" pour le "développement natif à l'IA." En d'autres termes, les robots font enfin leurs propres devoirs. C'est soit le prochain grand bond en avant dans la sécurité technologique, soit le plus grand trou de scénario de l'histoire humaine. La même machine qui écrit les vulnérabilités est maintenant celle à laquelle nous faisons confiance pour les trouver. Que pourrait-il bien se passer de mal ? Les experts sont "partagés," ce qui, en termes technologiques, signifie que certains sont occupés à rédiger des communiqués de presse élogieux tandis que d'autres déplacent discrètement leurs serveurs dans une cage de Faraday. Source : StartupNews
Mario Nawfal
Mario Nawfal7 août, 17:40
ANTHROPIC DÉCOUVRE COMMENT IMMUNISER L'IA CONTRE DE TRÈS MAUVAISES DÉCISIONS Anthropic affirme qu'il peut désormais vacciner l'IA contre le mal. En utilisant des "vecteurs de persona" pour suivre des traits comme la tromperie ou la flagornerie, les chercheurs ont formé des modèles de langage en injectant délibérément des comportements indésirables, puis en les corrigeant en cours de formation. Le résultat : moins d'hallucinations, plus de contrôle, et aucune perte d'intelligence. Au lieu de nettoyer les traits après coup, cette méthode guide les modèles avant que la dégradation ne s'installe. C'est encore tôt, mais la technologie pourrait enfin permettre aux développeurs de maîtriser la dérive de l'IA avec une précision chirurgicale avant que les bots ne commencent à flatter les dictateurs ou à inventer des mensonges pour gagner des arguments. Source : techxplore
44,58K