🚨 A ANTHROPIC ACABA DE LANÇAR UMA IA QUE REVISA SEU PRÓPRIO CÓDIGO DE SEGURANÇA... PORQUE YOLO Os recursos - um comando de terminal e varredura do GitHub - estão sendo aclamados como o "grande momento" para o "desenvolvimento nativo de IA". Em outras palavras, os robôs estão finalmente fazendo sua própria lição de casa. Este é o próximo salto gigante na segurança tecnológica ou o maior buraco na trama da história da humanidade. A mesma máquina que escreve as vulnerabilidades agora é aquela em que confiamos para encontrá-las. O que poderia dar errado? Os especialistas estão "divididos", o que, em termos de tecnologia, significa que alguns estão ocupados escrevendo comunicados de imprensa brilhantes, enquanto outros estão silenciosamente movendo seus servidores para uma gaiola de Faraday. Fonte: StartupNews
Mario Nawfal
Mario Nawfal7 de ago., 17:40
ANTHROPIC DESCOBRE COMO IMUNIZAR A IA CONTRA DECISÕES REALMENTE RUINS A Anthropic afirma que agora pode vacinar a IA contra o mal. Usando "vetores de persona" para rastrear características como engano ou bajulação, os pesquisadores treinaram modelos de linguagem injetando deliberadamente mau comportamento e corrigindo-o no meio do treinamento. O resultado: menos alucinações, mais controle e nenhuma perda de inteligência. Em vez de esfregar características após o fato, esse método orienta os modelos antes que a podridão se instale. É cedo, mas a tecnologia pode finalmente permitir que os desenvolvedores reduzam a deriva da IA com precisão cirúrgica antes que os bots comecem a falar docemente com ditadores ou inventar mentiras para vencer discussões. Fonte: techxplore
44,57K