Una frustración que he tenido esta semana es que algunas versiones de LLM funcionan mucho mejor y peor para algunos prompts. Por ejemplo, algunas (incluso en la misma familia o misma versión) tenían consistentemente un error de análisis en cosas que el resto de los LLMs podían manejar. Me molestó, pero lo dejé pasar.
16,65K