GPT-5 a été annoncé comme réduisant les hallucinations et il semble qu’il soit à la hauteur. 99,5 -> 99,9, c’est 80 % d’erreurs en moins. Je ne sais pas pourquoi les gens n’en font pas toute une histoire. Les hallucinations sont l’un des plus gros problèmes des LLM et certains pensaient qu’elles étaient insolubles.
OpenRouter
OpenRouter15 août, 00:29
Après une semaine, GPT-5 a dominé nos classements de modèles propriétaires pour la précision d'appel d'outils🥇 En deuxième position, Claude 4.1 Opus, à 99,5% Détails 👇
135,55K