Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Штучний інтелект DeepMind винаходить кращий спосіб навчання: прорив у навчанні з підкріпленням
Дослідники з DeepMind продемонстрували, що штучний інтелект може автономно виявляти алгоритми навчання з підкріпленням (RL), які перевершують ті, які ретельно розроблені людьми.
Цей прогрес кидає виклик традиційній парадигмі, де правила RL розробляються вручну, прокладаючи шлях для машин розвивати свої власні стратегії навчання лише на основі досвіду.
Основна інновація полягає в навчанні з мета-підкріпленням, методі, коли система штучного інтелекту вчиться вчитися, спираючись на колективний досвід кількох агентів, які орієнтуються в складних середовищах.
Замість того, щоб покладатися на заздалегідь визначені правила, штучний інтелект ітеративно вдосконалює новий метод оновлення політик і прогнозів. При тестуванні на класичному тесті Atari — наборі відеоігор, які використовуються для оцінки продуктивності RL — виявлений алгоритм не тільки перевершив існуючі правила, розроблені людиною, але й чудово впорався з абсолютно новими, складними завданнями, з якими він ніколи не стикався під час навчання.
Це не поступове покращення, а концептуальне зрушення. Штучний інтелект може прискорити прогрес у сферах, що вимагають адаптивного інтелекту, від робототехніки до наукових відкриттів.
Автоматизувавши процес виявлення, ми незабаром можемо побачити системи штучного інтелекту, які використовують власні досягнення, зменшуючи потребу в людському втручанні та потенційно призводячи до більш надійного та узагальнюваного штучного інтелекту.
Папір:

Найкращі
Рейтинг
Вибране

