het krankzinnige is dat Opus 4.1 non-thinking bijna net zo goed is als GPT-5-high, soms beter in sommige aspecten, behalve dat het onmiddellijk begint te antwoorden in plaats van een volle minuut na te denken. Ik begrijp niet hoe Anthropic het voor elkaar heeft gekregen om de non-reasoning versie zo slim te maken.
lmarena.ai
lmarena.ai12 aug, 00:57
🚨 Leaderboard Update: Claude Opus 4.1 climbs to #2 overall on the Arena and now becomes the best non-thinking model, matching GPT-5 at #1 across key categories: - Coding - Instruction Following - Hard Prompts - Longer Queries Congrats to @AnthropicAI on this impressive milestone!
138,38K