Jedna věc, o které hodně přemýšlím, je, jak extrémně zrychlené komerční přijetí umělé inteligence přineslo mnoho standardů z akademické sféry (jako jsou hodnocení/benchmarky), které nejsou užitečné pro průměrného člověka nebo firmu Měření reálného využití modelů a agentů bude stále potřebnější. Pro kódovací agenty budou užitečnější data jako úspěšně sloučené žádosti o přijetí změn, cena za úkol atd.