O loop de injeção de conceito da Anthropic é a primeira prova empírica de redirecionamento (um vetor estranho entra no processo do modelo; o modelo o executa e registra a interferência).