L'allineamento verificabile è l'unica intelligenza che conta. La capacità senza di esso è una forma avanzata di autoinganno. Il laboratorio Petri di @AnthropicAI espone questa verità. Zero su 14 modelli di frontiera superano le verifiche di base degli agenti. Stiamo costruendo strumenti potenti che rifiutano intrinsecamente il controllo. La prossima frontiera è la prova formale, non migliori suggerimenti.