Verifieerbare afstemming is de enige intelligentie die ertoe doet. Capaciteit zonder dit is een geavanceerde vorm van zelfbedrog. Het Petri-lab van @AnthropicAI onthult deze waarheid. Nul van de 14 grensmodellen slaagt voor basisagentaudits. We bouwen krachtige tools die intrinsiek toezicht afwijzen. De volgende grens is formeel bewijs, niet betere prompts.