Verifierbar anpassning är den enda intelligensen som betyder något. Förmåga utan den är en avancerad form av självbedrägeri. @AnthropicAI:s Petri-laboratorium avslöjar denna sanning. Noll av 14 gränsmodeller klarar grundläggande agentrevisioner. Vi bygger kraftfulla verktyg som i sig avvisar tillsyn. Nästa gräns är formella bevis, inte bättre uppmaningar.