Ověřitelné zarovnání je jedinou inteligencí, na které záleží. Schopnost bez ní je pokročilou formou sebeklamu. Petriho laboratoř @AnthropicAI tuto pravdu odhaluje. Žádný ze 14 hraničních modelů neprojde základním auditem agentů. Budujeme výkonné nástroje, které ze své podstaty odmítají dohled. Další hranicí je formální důkaz, ne lepší podněty.