dit onderschat drastisch de prestatieverbeteringen tussen GPT-4 en Opus 4.5, en hoe die prestatieverbeteringen "problemen gladstrijken" die zich zouden opstapelen in alles van CoT tot functieaanroepen