Estive a testar o Opus 4.5 contra o GPT-5.1-Codex-Max em tarefas de backend nas últimas 24 horas, e honestamente, não consigo decidir um vencedor claro. Normalmente, ao comparar modelos, o vencedor é bastante claro muito rapidamente. Não desta vez. Os testes continuam.