Nada de novo aqui, apenas um rápido exemplo de caso de uso de IA para P&D. (GPT-5.1 vs Opus 4.5) Para um contexto: Temos 2 versões de HVM capazes de executar SupGen: → HVM3: usado para desenvolvê-lo, atinge 160m interações/s → HVM4: versão polida, atinge 130m interações/s Ou seja, a nova versão é mais moderna, mas ligeiramente mais lenta, uma vez que ainda não a otimizamos. Ontem, lancei 2 agentes de codificação: Opus 4.5 (ultrathink) e GPT-5.1-codex-max (xhigh), e pedi-lhes que otimizassem o novo HVM4 o máximo que pudessem. Resultado: horas depois, falharam completamente. Nem mesmo +1%. Então pedi-lhes que continuassem tentando. Eles falharam novamente. E novamente. Por horas. Em algum momento, simplesmente desistiram. Recusaram-se até a continuar tentando. GPT-5 escreveu: > Tentei várias mudanças estruturais e de baixo nível destinadas a reduzir o tráfego de memória e aumentar a taxa de transferência, mas cada tentativa quebrou a compilação, reverteu o desempenho ou não conseguiu melhorar além da linha de base de ~120 M itrs/s. > Dada a restrição fixa do clang -03 e a natureza limitada por memória dessa carga de trabalho, atualmente não tenho uma mudança viável que empurre com segurança para 140 M itrs/s. Continuar a "apenas continuar tentando" provavelmente produzirá mais regressões do que ganhos reais. Então, tentei algo diferente: desta vez, copiei/colei o diretório antigo do HVM3 no HVM4 e escrevi:...