New Yorker: De winstparadox van kunstmatige intelligentie en historische lessen Auteur: John Cassidy In 1987 merkte Nobelprijswinnaar economie Robert Solow van het Massachusetts Institute of Technology (M.I.T.) in een artikel in de Times Literary Supplement op: "De computerrevolutie is overal zichtbaar, behalve in de productiviteitsstatistieken." Ondanks de snelle vooruitgang in rekenkracht en de toenemende populariteit van persoonlijke computers, toonde overheidsdata aan dat een cruciale indicator voor het meten van lonen en levensstandaard - de totale output per werknemer - meer dan tien jaar stagneerde. Dit leidde tot de later beroemde "productiviteitsparadox". Deze paradox hield aan tot in de jaren '90 en zelfs langer, wat leidde tot een overvloed aan tegenstrijdige academische studies. Sommige economen gaven de schuld aan slecht management van nieuwe technologieën; anderen meenden dat computers economisch gezien minder belangrijk waren in vergelijking met vroege uitvindingen zoals de stoommachine en elektriciteit; weer anderen gaven de statistieken de schuld en dachten dat de paradox zou verdwijnen als de gegevens gecorrigeerd werden. Bijna veertig jaar na de publicatie van Solow's artikel, en bijna drie jaar na de lancering van de ChatGPT-chatbot door OpenAI, staan we mogelijk voor een nieuwe economische paradox, dit keer met generatieve kunstmatige intelligentie (generative artificial intelligence) als hoofdrolspeler. Volgens een recente enquête van economen van Stanford University, Clemson University en de Wereldbank, gebruikte in juni en juli van dit jaar bijna de helft van de werknemers (precies 45,6%) AI-tools. Echter, een nieuw onderzoek van een team van het M.I.T. Media Lab rapporteerde een schokkende bevinding: "Ondanks dat bedrijven tussen de 30 en 40 miljard dollar in generatieve AI hebben geïnvesteerd, ontdekte dit rapport dat 95% van de organisaties geen rendement oplevert." De auteurs van het onderzoek hebben meer dan driehonderd openbare AI-projecten en aankondigingen onderzocht en meer dan vijftig bedrijfsleiders geïnterviewd. Hun definitie van "succesvolle AI-investeringen" is: projecten die de pilotfase hebben overschreden en daadwerkelijk zijn geïmplementeerd, en die na zes maanden meetbare financiële rendementen of significante productiviteitsverbeteringen hebben opgeleverd. Ze schreven: "Slechts 5% van de succesvol geïntegreerde AI-pilotprojecten genereert miljoenen dollars aan waarde, terwijl de overgrote meerderheid van de projecten stagneert en geen meetbare impact heeft op de P&L (winst- en verliesrekening)." De enquête-interviews leidden tot een reeks reacties, waarvan sommige vol twijfel waren. "Op LinkedIn wordt er veel over gepraat, alsof alles veranderd is, maar in onze dagelijkse operaties is er niets fundamenteels veranderd," vertelde de COO van een middelgroot productiebedrijf aan de onderzoekers. "We verwerken contracten iets sneller, maar dat is alles." Een andere geïnterviewde merkte op: "We hebben dit jaar tientallen demonstraties gezien. Misschien zijn er één of twee echt nuttig. De rest zijn ofwel 'wrappers' (die alleen bestaande technologie verpakken zonder echte innovatie), ofwel 'wetenschappelijke projecten' (technologische verkenningen die nog ver van praktische commerciële toepassingen staan)." Eerlijk gezegd wijst het rapport ook op enkele bedrijven die succesvolle AI-investeringen hebben gedaan. Het rapport benadrukt de efficiëntie die is gecreëerd door op maat gemaakte tools voor back-office-operaties en merkt op: "Deze vroege resultaten tonen aan dat systemen met leermogelijkheden, wanneer ze zijn afgestemd op specifieke processen, daadwerkelijk echte waarde kunnen opleveren, zelfs zonder grote organisatorische veranderingen." De enquête vermeldt ook dat sommige bedrijven rapporteren dat ze "de klantretentie en conversieratio's hebben verbeterd door automatisering van outreach en intelligente opvolgsystemen", wat aangeeft dat AI-systemen mogelijk nuttig zijn voor marketing. Echter, de opvatting dat "veel bedrijven moeite hebben om substantiële rendementen te behalen" komt overeen met een andere recente enquête van het multinationale adviesbedrijf Akkodis. Na contact met meer dan tweeduizend bedrijfsleiders ontdekte het bedrijf dat het percentage CEO's dat "zeer vertrouwen heeft in de AI-implementatiestrategie van hun bedrijf" is gedaald van 82% in 2024 naar 49% dit jaar. Het vertrouwen van de CTO's van bedrijven is ook gedaald, hoewel de daling niet zo groot is. De enquête van Akkodis stelt dat deze veranderingen "mogelijk de teleurstellende resultaten van eerdere digitaliserings- of AI-projecten, vertragingen of mislukkingen in de implementatie, en zorgen over schaalbaarheid weerspiegelen." Vorige week viel de media-aandacht voor het onderzoek van het M.I.T. Media Lab samen met de daling van hoog gewaardeerde AI-gerelateerde aandelen zoals Nvidia, Meta en Palantir. Natuurlijk betekent correlatie niet causaliteit; de recente opmerkingen van OpenAI CEO Sam Altman kunnen een belangrijkere rol hebben gespeeld in deze verkoopgolf (gezien de recente prijsstijgingen was een verkoopgolf onvermijdelijk). Volgens CNBC zei Altman tijdens een diner met journalisten dat de huidige waarderingen "belachelijk hoog" (insane) zijn en gebruikte hij het woord "bubbel" (bubble) drie keer in vijftien seconden. Desondanks heeft het onderzoek van het M.I.T. veel aandacht getrokken. Na de eerste ronde van nieuwsberichten zijn er berichten dat het Media Lab, dat verbonden is met veel technologiebedrijven, stilletjes de toegang tot het rapport beperkt. De berichten die ik heb achtergelaten bij het PR-kantoor van de organisatie en bij twee auteurs van het rapport zijn onbeantwoord gebleven. Hoewel dit rapport subtieler is dan sommige nieuwsberichten suggereren, stelt het ongetwijfeld vragen bij het grote economische verhaal dat de technologische bloei sinds de lancering van ChatGPT door OpenAI in november 2022 heeft ondersteund. De verkorte versie van dit verhaal is: de brede verspreiding van generatieve AI is nadelig voor werknemers (vooral kenniswerkers), maar zeer voordelig voor bedrijven en hun aandeelhouders, omdat het enorme productiviteitsstijgingen zal opleveren en daardoor aanzienlijke winsten zal genereren. Waarom lijkt deze situatie nog niet te zijn gebeurd? Een mogelijke reden doet denken aan een opvatting uit de jaren '80 en '90, namelijk dat managementfouten de productiviteitsvoordelen van computers hebben beperkt. Het onderzoek van het Media Lab ontdekte dat enkele van de meest succesvolle AI-investeringen zijn gedaan door startups die zeer op maat gemaakte tools in smalle werkprocessen gebruiken. Aan de andere kant van de "generatieve AI-kloof" (GenAI Divide) zijn de minder succesvolle startups "ofwel bezig met het bouwen van algemene tools, ofwel proberen ze interne capaciteiten te ontwikkelen." Het rapport merkt algemener op dat de scheidslijn tussen succes en falen "blijkbaar niet wordt bepaald door de kwaliteit van het model of door regelgeving, maar door de (implementatie)methoden." Het is voorstelbaar dat de nieuwheid en complexiteit van generatieve AI sommige bedrijven afschrikt. Een recent onderzoek van Gartner ontdekte dat minder dan de helft van de CEO's gelooft dat hun CIO "bedreven is in AI". Maar voor de teleurstellende resultaten die in het Media Lab-rapport worden benadrukt, is er een andere mogelijke verklaring: voor veel gevestigde bedrijven is generatieve AI (tenzij in de huidige vorm) helemaal niet zo geweldig als wordt gepresenteerd. "Het is geweldig voor brainstormen en het schrijven van eerste versies, maar het onthoudt de voorkeuren van klanten niet en leert niet van eerdere bewerkingen," zei een respondent van het Media Lab-onderzoek. "Het herhaalt dezelfde fouten en vereist bij elke sessie veel contextinvoer. Voor risicovolle taken heb ik een systeem nodig dat kennis kan opbouwen en voortdurend kan verbeteren." Natuurlijk zijn er veel mensen die AI nuttig vinden, en er is academisch bewijs dat dit ondersteunt: in 2023 ontdekten twee economen van het M.I.T. dat deelnemers die in een willekeurige proef met ChatGPT in contact kwamen, sneller "professionele schrijfopdrachten" konden voltooien en dat de kwaliteit van het schrijven verbeterde. In hetzelfde jaar ontdekten andere onderzoeksteams dat programmeurs die Github's Copilot (een AI-programmeerassistent) gebruikten, evenals klantenservicemedewerkers die gebruik maakten van proprietary AI-tools, productiviteitsverbeteringen behaalden. Onderzoekers van het Media Lab ontdekten dat veel werknemers hun persoonlijke tools zoals GPT of Claude op het werk gebruiken; het rapport noemde dit fenomeen de "shadow AI economy" en merkte op dat "de ROI die het oplevert" vaak beter is dan de projecten die door werkgevers zijn geïnitieerd. Maar de vraag blijft bestaan, en dit is zeker een vraag die bedrijfsleiders vaker zullen stellen: waarom zien niet meer bedrijven deze voordelen weerspiegeld in de uiteindelijke (bedrijfs)winsten? Een deel van het probleem kan zijn dat, hoewel generatieve AI opvalt, de toepassingen ervan in veel sectoren van de economie beperkt zijn. De vrijetijds- en horecasector, de detailhandel, de bouwsector, de vastgoedsector en de zorgsector (verzorging van kinderen, ouderen of kwetsbaren) - deze sectoren hebben samen ongeveer vijftig miljoen Amerikanen in dienst, maar lijken geen directe kandidaten voor AI-transformatie. ...