GPT-5 se anunció como reductor de alucinaciones y parece que cumple. 99.5 -> 99.9 es un 80% menos de errores. No sé por qué la gente no está haciendo un gran problema con esto. Las alucinaciones son uno de los mayores problemas de los LLM y algunos pensaron que eran irresolubles.
OpenRouter
OpenRouter15 ago, 00:29
After one week, GPT-5 has topped our proprietary model charts for tool calling accuracy🥇 In second is Claude 4.1 Opus, at 99.5% Details 👇
135.49K