Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Greg Brockman
Président et cofondateur @OpenAI
GPT-5.1 Pro : « on a l'impression d'un pas vers des modèles qui pensent et communiquent davantage comme de véritables collègues, avec une meilleure expertise dans le domaine, une intuition et un jugement améliorés, ainsi qu'une empathie et des compétences en communication accrues »

Simon Smith20 nov., 05:54
D'accord, il semble que cela ait déjà été mentionné dans les notes de version (j'ai vérifié), donc... (note : tester des modèles fait partie de mon travail et ce post n'est sponsorisé par OpenAI d'aucune manière) :
J'ai été invité à tester en alpha GPT-5.1 Pro aux côtés d'experts en robotique, mathématiques, immunologie, médecine, musique, et plus encore. Mon domaine de prédilection était la recherche commerciale en sciences de la vie et la stratégie, ainsi que quelques cas d'utilisation personnelle.
Après avoir utilisé GPT-5.1 Pro pendant quelques jours, je le trouve plus semblable à un expert humain qu'à GPT-5 Pro, avec une écriture plus claire, un meilleur jugement, moins de digressions, une synthèse plus forte et des réponses plus émotionnellement conscientes.
J'ai confronté GPT-5.1 Pro à GPT-5 Pro sur des tâches professionnelles telles que la synthèse de la littérature scientifique, la planification de lancement de médicaments et l'analyse des médias sociaux. Je l'ai également essayé pour la planification financière personnelle et même le journal intime. C'était :
- Plus rigoureux et complet dans la recherche et la planification.
- Plus fort en raisonnement.
- Meilleur pour rester sur la bonne voie et éviter les digressions (et, dans au moins un cas, les erreurs associées).
- Beaucoup plus clair, plus confiant, plus empathique dans son style de communication.
Sachant que l'accent d'OpenAI est mis sur la performance dans le monde réel (par exemple, GDPval) et les rapports selon lesquels ils embauchent des experts de domaine dans des domaines comme la finance, je pense que l'expertise humaine est exactement ce qu'ils recherchent, et avec GPT-5.1 Pro, ils s'en rapprochent.
Cela dit, il n'est pas meilleur dans tout. Il est toujours mauvais pour créer des présentations de qualité professionnelle et des feuilles de calcul Excel, une faiblesse notable des modèles OpenAI sur laquelle je suis sûr qu'ils travaillent à corriger. Et j'ai vu qu'au moins un testeur a constaté que le modèle évitait de manière conservatrice de s'attaquer à des problèmes ouverts connus dans les domaines STEM, choisissant plutôt d'expliquer pourquoi ce sont des problèmes ouverts.
Dans l'ensemble, si je devais quantifier cela, je dirais que c'est un saut de 10 à 15 % par rapport à GPT-5 Pro pour les types de choses que j'utilise. Cela ressemble à un pas vers des modèles qui pensent et communiquent plus comme de vrais collègues, avec une meilleure expertise de domaine, intuition et jugement, ainsi qu'une empathie et des compétences en communication accrues.
Cela augure bien pour l'IA qui fera encore plus de travail impactant en 2026.
133,2K
Les progrès et la croissance de Codex sont tous deux extrêmement rapides

Sam Altman23 nov., 08:12
Il a été incroyable de voir les progrès de l'équipe Codex ; ce sont des bêtes.
Le produit/modèle est déjà si bon et va s'améliorer considérablement ; je crois qu'ils vont créer le meilleur et le plus important produit dans le domaine, et permettre tant de travaux en aval.
199,72K
Meilleurs
Classement
Favoris


