GPT-5 被宣传为减少幻觉,看来它确实做到了。99.5 -> 99.9 是减少了 80% 的错误。 我不知道为什么人们没有对此大惊小怪。幻觉是大型语言模型最大的一个问题,有些人认为这是无法解决的。
OpenRouter
OpenRouter8月15日 00:29
经过一周,GPT-5 在我们专有模型的工具调用准确率排行榜上名列第一🥇 第二名是 Claude 4.1 Opus,准确率为 99.5% 详情 👇
135.34K