Una cosa en la que pienso mucho es en cómo la adopción comercial extremadamente acelerada de la IA ha traído muchos estándares de la academia (como evaluaciones / puntos de referencia) que no son útiles para la persona o empresa promedio La medición del uso en el mundo real de modelos y agentes será cada vez más necesaria. Para los agentes de codificación, los datos más útiles serán cosas como PR fusionados con éxito, costo por tarea, etc.