🚨 A ANTHROPIC ACABA DE LANÇAR UMA IA QUE REVÊ O SEU PRÓPRIO CÓDIGO PARA SEGURANÇA... PORQUE YOLO As funcionalidades - um comando de terminal e a verificação no GitHub - estão a ser aclamadas como o "grande momento" para o "desenvolvimento nativo de IA." Em outras palavras, os robôs estão finalmente a fazer os seus próprios trabalhos de casa. Isto é, ou o próximo grande salto na segurança tecnológica ou o maior buraco na trama da história humana. A mesma máquina que escreve as vulnerabilidades é agora aquela em que confiamos para as encontrar. O que poderia possivelmente correr mal? Os especialistas estão "divididos," o que em termos tecnológicos significa que alguns estão ocupados a escrever comunicados de imprensa elogiosos enquanto outros estão silenciosamente a mover os seus servidores para uma jaula de Faraday. Fonte: StartupNews
Mario Nawfal
Mario Nawfal7/08, 17:40
ANTHROPIC DESCOBRE COMO IMUNIZAR A IA CONTRA DECISÕES REALMENTE RUINS A Anthropic afirma que agora pode vacinar a IA contra o mal. Usando "vetores de persona" para rastrear traços como engano ou bajulação, os pesquisadores treinaram modelos de linguagem injetando deliberadamente comportamentos ruins e, em seguida, corrigindo-os durante o treinamento. O resultado: menos alucinações, mais controle e nenhuma perda de inteligência. Em vez de eliminar traços após o fato, este método orienta os modelos antes que a deterioração comece. É cedo, mas a tecnologia pode finalmente permitir que os desenvolvedores contenham a deriva da IA com precisão cirúrgica antes que os bots comecem a adular ditadores ou a inventar mentiras para vencer argumentos. Fonte: techxplore
44,57K