Vi körde vår senaste Box AI-utvärdering av avancerad resonemang på Opus 4.5 med medel- och hög ansträngning och såg en ökning på 20 procentenheter jämfört med Opus 4.1. Det som är galet att tänka på är att Opus 4.1 kom ut för bara 3 månader sedan. Denna utvärdering närmar sig att approximera vad en kunskapsarbetare gör som en separat uppgift med sina företagsdokument. Det kan vara en finansiell analytiker som analyserar ett företag eller en konsult som gör research åt en kund. Utvärderingen bedömer modellen utifrån hur den besvarar en komplex affärsprompt utifrån en rad kriterier. Vi är fortfarande tidiga med denna utvärdering och kommer att utöka den till ett bredare spektrum av branscher och användningsområden. Det som är tydligt är att dessa senaste resonemangsmodeller kommer att bli bättre och bättre på ekonomiskt användbart arbete i varje uppdatering. Detta började initialt med kodning, men vi kommer att se liknande uppgraderingar inom sjukvård, juridik, finansiella tjänster, tillverkning och många andra områden.