这大大低估了GPT-4和Opus 4.5之间的性能飞跃,以及这些性能飞跃是如何“解决”从CoT到函数调用的所有问题的。