Ik ben het bijzonder eens met de mening van Terence Tao: in de huidige fase is het meest geschikte gebruik van AI niet om de krachtigste AI-modellen direct in te zetten voor het oplossen van de moeilijkste wiskundige problemen, maar een bredere en praktischere toepassing zou kunnen zijn om die AI-tools met gemiddelde prestaties te gebruiken om wiskundigen te helpen bij het versnellen van de dagelijkse, saaie maar essentiële basisonderzoekstaken. Een paar dagen geleden hoorde ik iemand van CVS delen dat de CVS-apotheek het druk heeft, maar dat het grootste deel van de tijd verspild wordt aan saaie taken, zoals het tellen van pillen, omdat het aantal pillen voor elke patiënt anders is. Dit vereist twee professionele apothekers: één die verantwoordelijk is voor het vullen van de juiste hoeveelheid pillen in de fles en één die verantwoordelijk is voor het verifiëren van het aantal pillen in de fles. Een groep hoogopgeleide, professioneel opgeleide apothekers moet elke dag veel tijd aan deze taken besteden. Daarom hebben ze onlangs AI + robots gebruikt om dit proces te automatiseren, zodat apothekers zich kunnen richten op belangrijkere taken. Zelf gebruik ik AI ook op een vergelijkbare manier in mijn dagelijks leven. Het kan me misschien niet helpen bij het oplossen van veel technische problemen, maar ik kan AI gebruiken om enkele kleine tools te ontwikkelen, of door specifieke prompts te gebruiken, kan het me helpen bij veel saaie taken, wat mijn algehele efficiëntie al enorm kan verhogen. --- De originele vertaling is te vinden in de reacties.
Terence Tao: Mijn gedachten over de recente toepassingen van AI in de wiskunde De laatste tijd heb ik steeds meer het gevoel dat de meest effectieve toepassingen van kunstmatige intelligentie (AI) in de wiskunde op korte termijn niet noodzakelijkerwijs zijn om de krachtigste AI-modellen direct in te zetten voor de moeilijkste wiskundige problemen. Natuurlijk zien we af en toe enkele bijzonder succesvolle gevallen, maar die zijn vaak het resultaat van enorme rekenkracht en de inspanningen van top-experts. De echt bredere en praktischere toepassingen zijn misschien juist het gebruik van AI-tools met gemiddelde prestaties om wiskundigen te helpen bij het versnellen van de uitvoering van die dagelijkse, vervelende maar essentiële basisonderzoekstaken. Deze ogenschijnlijk alledaagse taken kunnen in principe door menselijke experts worden uitgevoerd, maar het kost meer tijd en moeite. Dit is echter een groot voordeel van AI-toepassingen en geen tekortkoming. Omdat menselijke experts al veel ervaring en intuïtie hebben opgebouwd, kunnen ze snel en nauwkeurig beoordelen of de output van AI betrouwbaar is en deze veilig integreren in hun onderzoeksprocessen. Een eenvoudig voorbeeld: literatuuronderzoek. Wiskundigen moeten voordat ze een probleem onderzoeken vaak veel bestaande onderzoeksdocumenten raadplegen. Als het probleem al een erkende naam heeft en er een actieve onderzoeksgemeenschap is, zijn de bestaande zoekmachines en academische databases al meer dan voldoende. Wiskundigen hoeven alleen maar te beginnen met een belangrijk artikel, de citatielijn voorwaarts en achterwaarts te volgen, en ze kunnen snel de voortgang van het onderzoek naar het probleem begrijpen. Echter, er zijn veel gevallen waarin een onderzoeksprobleem geen uniforme naam heeft en verschillende wetenschappers mogelijk hun eigen weg gaan. De relevante literatuur is verspreid over verschillende tijdschriften, conferenties en boeken, en de citatieverhoudingen zijn chaotisch. Soms vermeldt een artikel slechts een klein deel van het probleem, vermengd met een overvloed aan irrelevante inhoud. Het kan bijzonder moeilijk zijn om in zo'n situatie echt waardevolle literatuur te vinden: het kan nodig zijn om artikelen te zoeken, herhaaldelijk te filteren, en het is goed mogelijk dat je urenlang zoekt zonder iets te vinden dat relevant is voor je probleem. Maar zodra je echt relevante artikelen hebt gevonden, kan een expert ze snel doorbladeren en onmiddellijk beoordelen of het artikel bij het huidige probleem bijdraagt. Deze snelle verificatiecapaciteit maakt AI juist bijzonder geschikt voor literatuuronderzoek (mits de onderzoeker zelf over de relevante expertise beschikt om de kwaliteit van de literatuur onafhankelijk te beoordelen). Vooral wanneer onderzoekers zich op meerdere onderzoeksproblemen tegelijk moeten concentreren, wordt het voordeel van het gebruik van AI nog duidelijker. In dit scenario hoeft AI niet honderd procent nauwkeurig te zijn; zolang de slagingskans hoog genoeg is, zal de algehele efficiëntie veel hoger zijn dan bij traditionele methoden. Bovendien kan de tijd die onderzoekers besteden aan het leren hoe ze AI-tools effectief kunnen gebruiken, in de loop van herhaald gebruik geleidelijk de kosten verlagen. Onlangs vond er een zeer typisch voorbeeld plaats in de wiskundige gemeenschap: De beroemde wiskundige Paul Erdős stelde tijdens zijn leven veel interessante wiskundige problemen voor. Momenteel zijn er op de website Erdős Problems, die speciaal is opgezet om deze problemen te verzamelen en te ordenen, meer dan duizend problemen, waarvan ongeveer 600 zijn gemarkeerd als "onopgelost" (open). Hoewel sommige problemen al breed zijn bestudeerd, zijn er ook veel relatief obscure problemen waarvoor het moeilijk is om te bepalen of er oplossingen zijn, alleen met eenvoudige handmatige zoekopdrachten. De afgelopen dagen zijn enkele onderzoekers begonnen met het systematisch gebruiken van AI-tools om relevante literatuur te helpen doorzoeken. Ze publiceren de output van AI niet direct op de website, maar verifiëren deze eerst handmatig om te bevestigen dat deze effectief is, voordat ze commentaar of aantekeningen toevoegen. In slechts enkele dagen tijd hebben ze met deze methode van "AI-ondersteund literatuuronderzoek + handmatige bevestiging" al met succes ten minste 6 oplossingen voor problemen ontdekt. Deze problemen waren oorspronkelijk gemarkeerd als "onopgelost", maar de status is nu veranderd in "opgelost" (solved). Bijvoorbeeld: probleem 339, probleem 1043, probleem 494, probleem 621, probleem 822, probleem 903. Er zijn nog een tiental problemen die nog niet zijn opgelost, maar de relevante literatuur is met succes doorzocht en na handmatige bevestiging aan de opmerkingen op de probleempagina toegevoegd. Hoewel niet elke opmerking expliciet vermeldt dat AI is gebruikt, suggereert de aanzienlijke toename van het aantal opmerkingen op korte termijn de bijdrage van AI. Een ander potentieel voordeel van deze AI-tools is dat ze op een natuurlijkere manier "negatieve resultaten" (negative results, dat wil zeggen "geen relevante literatuur gevonden") kunnen rapporteren. Over het algemeen, als onderzoekers literatuuronderzoek doen en niets vinden, zullen ze dat meestal niet speciaal rapporteren, uit angst om een belangrijk artikel te missen, wat ongemakkelijk kan zijn. Deze stilte leidt in feite tot veel overbodig herhalingswerk - verschillende onderzoekers hebben misschien veel tijd besteed aan het zoeken naar niet-bestaande literatuur, of ten onrechte gedacht dat een probleem nog niet was opgelost, terwijl ze in werkelijkheid nooit serieus literatuuronderzoek hebben gedaan. Wanneer AI-tools systematisch grote literatuuronderzoekstaken verwerken, zijn onderzoekers natuurlijk eerder geneigd om deze "negatieve resultaten" openbaar te rapporteren. Bijvoorbeeld: "AI-tools hebben 36 problemen gecontroleerd, waarvan 24 (66%) nieuwe effectieve literatuur hebben gevonden, en de andere 12 (33%) alleen bekende of irrelevante resultaten hebben opgeleverd." Deze open en transparante aanpak kan de hele academische gemeenschap helpen om beter te begrijpen hoe de onderzoeksstatus van een bepaald probleem is, en voorkomt veel onnodig herhalingswerk. Samenvattend, in het domein van wiskundig onderzoek kan de meest effectieve manier om AI op korte termijn te gebruiken, precies deze ogenschijnlijk "alledaagse" maar cruciale basisactiviteiten zijn voor menselijke experts. AI speelt hier niet de rol van een supergenie, maar van een efficiëntieversneller. Het kan onderzoekers helpen om meer waardevolle energie vrij te maken van vervelende basiszaken en zich beter te concentreren op de gebieden die echt innovatie en diepgaand denken vereisen.
91,46K