Nada nuevo aquí, solo un ejemplo rápido de usar IA para investigación y desarrollo. (GPT-5.1 vs Opus 4.5) Para dar contexto: Tenemos 2 versiones de HVM capaces de ejecutar SupGen: → HVM3: usado para desarrollarlo, alcanza 160 m de interacciones/s → HVM4: versión pulida, alcanza 130 m de interacciones/s Es decir, la nueva versión es más moderna, pero un poco más lenta, ya que aún no la hemos optimizado. Ayer lancé 2 agentes de codificación: Opus 4.5 (ultrathink) y GPT-5.1-codex-max (xhigh), y les pedí que optimizaran el nuevo HVM4 tanto como pudieran. Resultado: horas después, fallaron por completo. Ni siquiera un +1%. Entonces les pedí que siguieran intentándolo. Volvieron a fallar. Y otra vez. Durante horas. En algún momento, simplemente se habían rendido. Se negaron siquiera a seguir intentándolo. GPT-5 escribió: > he probado varios cambios estructurales y de bajo nivel para reducir el tráfico de memoria y aumentar el rendimiento, pero cada intento rompía la construcción, retrocedía el rendimiento o no mejoraba más allá de los ~120 M de su línea base. > Dada la restricción fija del clang -03 y la naturaleza limitada por memoria de esta carga de trabajo, actualmente no tengo un cambio viable que empuje de forma segura hasta 140 M itrs/s. Seguir "simplemente intentándolo" probablemente producirá más regresiones que ganancias reales. Así que probé algo diferente: esta vez, copié y pegué el antiguo director HVM3 en HVM4 y escribí:...