Une chose à laquelle je pense beaucoup est la manière dont l'adoption commerciale de l'IA s'est extrêmement accélérée, apportant avec elle de nombreux standards issus du milieu académique (comme les évaluations/benchmarks) qui ne sont pas utiles à la personne ou à l'entreprise moyenne. Mesurer l'utilisation réelle des modèles et des agents va devenir de plus en plus nécessaire. Pour les agents de codage, des données plus utiles seront des éléments comme les PR (pull requests) fusionnées avec succès, le coût par tâche, etc.