testámos mais de 500 modelos este ano, lançando um produto de IA com mais de 6 mil utilizadores. observado: 1. o chat está a atingir um teto 2. as guerras de modelos depreciam modelos mais antigos 3. o código aberto é melhor para os construtores 4. as avaliações devem medir a execução de tarefas 5. o contexto é mais importante do que o raciocínio aprimorado