Eine Sache, über die ich viel nachdenke, ist, wie extrem beschleunigte kommerzielle Akzeptanz von AI viele Standards aus der Wissenschaft (wie Bewertungen/Benchmarks) mitgebracht hat, die für die durchschnittliche Person oder das Unternehmen nicht nützlich sind. Die Messung der realen Nutzung von Modellen und Agenten wird zunehmend notwendig werden. Für Codierungsagenten werden nützlichere Daten Dinge wie erfolgreich zusammengeführte PRs, Kosten pro Aufgabe usw. sein.