Одна из вещей, о которых я много думаю, это то, как крайне ускоренное коммерческое внедрение AI привнесло множество стандартов из академической среды (таких как оценки/бенчмарки), которые не полезны среднему человеку или бизнесу. Измерение реального использования моделей и агентов будет становиться все более необходимым. Для кодирующих агентов более полезными данными будут такие вещи, как успешно объединенные PR, стоимость за задачу и т.д.