Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Искусственный интеллект DeepMind изобретает лучший способ обучения: прорыв в обучении с подкреплением
Исследователи из DeepMind продемонстрировали, что искусственный интеллект может самостоятельно открывать алгоритмы обучения с подкреплением (RL), которые превосходят те, что тщательно разработаны людьми.
Этот прогресс ставит под сомнение традиционную парадигму, в которой правила RL разрабатываются вручную, открывая путь для машин, чтобы развивать свои собственные стратегии обучения только на основе опыта.
Основная инновация заключается в мета-обучении с подкреплением, технике, при которой система ИИ учится *как* учиться, опираясь на коллективный опыт нескольких агентов, работающих в сложных условиях.
Вместо того чтобы полагаться на заранее определенные правила, ИИ итеративно уточняет новый метод обновления политик и прогнозов. При тестировании на классическом бенчмарке Atari — наборе видеоигр, используемом для оценки производительности RL — обнаруженный алгоритм не только превзошел существующие правила, разработанные людьми, но и отлично справился с совершенно новыми, сложными задачами, с которыми он никогда не сталкивался во время обучения.
Это не просто постепенное улучшение, это концептуальный сдвиг. ИИ может ускорить прогресс в областях, требующих адаптивного интеллекта, от робототехники до научных открытий.
Автоматизируя процесс открытия, мы вскоре можем увидеть системы ИИ, которые самостоятельно развивают свои достижения, уменьшая необходимость в человеческом вмешательстве и потенциально приводя к более надежному и обобщаемому искусственному интеллекту.
Статья:

Топ
Рейтинг
Избранное

