ini secara drastis meremehkan lompatan kinerja antara GPT-4 dan Opus 4.5, dan bagaimana lompatan kinerja tersebut "menyetrika" masalah yang akan bertambah dalam segala hal mulai dari CoT hingga panggilan fungsi