Jag har nu testat Opus 4.5 mot GPT-5.1-Codex-Max på backend-uppgifter de senaste 24 timmarna, och ärligt talat kan jag inte bestämma mig för en tydlig vinnare. Vanligtvis när man jämför modeller är vinnaren ganska tydlig väldigt snabbt. Inte den här gången. Testerna fortsätter.