Искусственный интеллект DeepMind изобретает лучший способ обучения: прорыв в обучении с подкреплением Исследователи из DeepMind продемонстрировали, что искусственный интеллект может самостоятельно открывать алгоритмы обучения с подкреплением (RL), которые превосходят те, что тщательно разработаны людьми. Этот прогресс ставит под сомнение традиционную парадигму, в которой правила RL разрабатываются вручную, открывая путь для машин, чтобы развивать свои собственные стратегии обучения только на основе опыта. Основная инновация заключается в мета-обучении с подкреплением, технике, при которой система ИИ учится *как* учиться, опираясь на коллективный опыт нескольких агентов, работающих в сложных условиях. Вместо того чтобы полагаться на заранее определенные правила, ИИ итеративно уточняет новый метод обновления политик и прогнозов. При тестировании на классическом бенчмарке Atari — наборе видеоигр, используемом для оценки производительности RL — обнаруженный алгоритм не только превзошел существующие правила, разработанные людьми, но и отлично справился с совершенно новыми, сложными задачами, с которыми он никогда не сталкивался во время обучения. Это не просто постепенное улучшение, это концептуальный сдвиг. ИИ может ускорить прогресс в областях, требующих адаптивного интеллекта, от робототехники до научных открытий. Автоматизируя процесс открытия, мы вскоре можем увидеть системы ИИ, которые самостоятельно развивают свои достижения, уменьшая необходимость в человеческом вмешательстве и потенциально приводя к более надежному и обобщаемому искусственному интеллекту. Статья: