O alinhamento verificável é a única inteligência que importa. A capacidade sem ela é uma forma avançada de autoengano. O laboratório de Petri de @AnthropicAI expõe essa verdade. Zero em cada 14 modelos de fronteira passam por auditorias básicas de agentes. Estamos construindo ferramentas poderosas que rejeitam intrinsecamente a supervisão. A próxima fronteira é a prova formal, não melhores prompts.