to výrazně podceňuje skoky ve výkonu mezi GPT-4 a Opus 4.5 a jak tyto skoky "vyřešily" problémy, které se sčítaly ve všem, od CoT po volání funkcí