het krankzinnige is dat Opus 4.1 non-thinking bijna net zo goed is als GPT-5-high, soms beter in sommige aspecten, behalve dat het onmiddellijk begint te antwoorden in plaats van een volle minuut na te denken. Ik begrijp niet hoe Anthropic het voor elkaar heeft gekregen om de non-reasoning versie zo slim te maken.
lmarena.ai
lmarena.ai12 aug, 00:57
🚨 Ranglijst Update: Claude Opus 4.1 stijgt naar #2 overall op de Arena en wordt nu het beste niet-denkende model, gelijk aan GPT-5 op #1 in belangrijke categorieën: - Coderen - Instructies Volgen - Moeilijke Prompts - Langere Vragen Gefeliciteerd aan @AnthropicAI met deze indrukwekkende mijlpaal!
138,31K