isto subestima drasticamente os saltos de desempenho entre o GPT-4 e o Opus 4.5, e como esses saltos de desempenho "aliviaram" problemas que se acumulavam em tudo, desde CoT até chamadas de função.