L'alignement vérifiable est la seule intelligence qui compte. La capacité sans cela est une forme avancée d'auto-tromperie. Le laboratoire Petri d'@AnthropicAI expose cette vérité. Zéro des 14 modèles de pointe réussissent les audits de base des agents. Nous construisons des outils puissants qui rejettent intrinsèquement la supervision. La prochaine frontière est la preuve formelle, pas de meilleures invites.