Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Greg Brockman
Президент і співзасновник @OpenAI
GPT-5.1 Pro: «відчувається як крок до моделей, які мислять і спілкуються більше як справжні колеги, з кращою експертизою, інтуїцією та судженням, а також підвищеною емпатією та комунікативними навичками»

Simon Smith20 лист., 05:54
Добре, схоже, це вже було написано в нотатках до релізу (я перевіряв), тож... (примітка: тестування моделей — частина моєї роботи, і цей допис жодним чином не спонсорується OpenAI):
Мене запросили провести альфа-тест GPT-5.1 Pro разом із експертами з робототехніки, математики, імунології, медицини, музики та іншого. Моя спеціалізація була на комерційних дослідженнях і стратегії наук про життя, а також на деяких особистих прикладах використання.
Після кількох днів використання GPT-5.1 Pro я вважаю його більше експертом з людської сфери, ніж GPT-5 Pro: з чіткішим письмом, кращим судженням, меншою кількістю відступів, сильнішим синтезом і більш емоційно усвідомленими реакціями.
Я проводив GPT-5.1 Pro один на один проти GPT-5 Pro на робочих завданнях, таких як синтез наукової літератури, планування запуску ліків і аналіз соціальних мереж. Я також пробував це для особистого фінансового планування і навіть ведення щоденника. Це було:
- Більш ретельний і комплексний у дослідженнях і плануванні.
- Сильніший у міркуванні.
- Краще триматися на шляху та уникати відхилень (і, принаймні в одному випадку, пов'язаних помилок).
- Набагато чіткіший, впевненіший, більш емпатичний у стилі спілкування.
Знаючи акцент OpenAI на реальній продуктивності (наприклад, GDPval) та повідомлення про найм експертів у сфері фінансів, я вважаю, що експертиза в людській сфері — саме те, чого вони прагнуть, і з GPT-5.1 Pro вони наближаються.
Втім, він не кращий у всьому. Він досі погано справляється з професійними презентаціями та таблицями в Excel, що є помітною слабкістю моделей OpenAI, яку вони намагаються виправити. І я побачив, що принаймні один тестувальник вважав, що модель обережно уникає розв'язання відомих відкритих проблем у STEM-доменах, натомість пояснюючи, чому це відкриті проблеми.
В цілому, якби мені довелося це кількісно оцінити, я б сказав, що це на 10-15% вище за GPT-5 Pro у тих цілях, для яких я його використовую. Це здається кроком до моделей, які мислять і спілкуються більше як справжні колеги, з кращою експертизою, інтуїцією та судженням, а також з підвищеною емпатією та комунікативними навичками.
Це добре обіцяє ШІ, який зробить ще більш впливову роботу у 2026 році.
171,41K
Прогрес і зростання кодексу надзвичайно швидкі

Sam Altman23 лист., 08:12
Було неймовірно спостерігати за прогресом команди Codex; Вони справжні чудовиська.
Продукт/модель вже дуже хороша і стане значно кращою; Я вірю, що вони створять найкращий і найважливіший продукт у цій сфері і дозволять реалізувати багато подальших робіт.
199,73K
Найкращі
Рейтинг
Вибране


