Uma frustração que tive esta semana é que algumas versões de LLM funcionam muito melhor e pior para alguns prompts. Por exemplo, algumas (mesmo na mesma família ou na mesma versão) tinham consistentemente um erro de análise em coisas que o resto dos LLMs conseguia lidar. Fiquei irritado, mas deixei pra lá.
16,95K