He estado probando Opus 4.5 contra GPT-5.1-Codex-Max en tareas de backend durante las últimas 24 horas, y honestamente, no puedo decidir un claro ganador. Normalmente, al comparar modelos, el ganador es bastante claro muy rápido. No esta vez. Las pruebas continúan.