Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
AI của DeepMind phát minh ra cách học tốt hơn: Một bước đột phá trong học tăng cường
Các nhà nghiên cứu tại DeepMind đã chứng minh rằng trí tuệ nhân tạo có thể tự động phát hiện các thuật toán học tăng cường (RL) vượt trội hơn so với những thuật toán được thiết kế tỉ mỉ bởi con người.
Sự tiến bộ này thách thức mô hình truyền thống, nơi các quy tắc RL được thiết kế thủ công, mở đường cho máy móc phát triển các chiến lược học tập của riêng chúng từ kinh nghiệm.
Sự đổi mới cốt lõi nằm ở học tăng cường meta, một kỹ thuật mà hệ thống AI học *cách* để học bằng cách rút ra từ những kinh nghiệm tập thể của nhiều tác nhân điều hướng trong các môi trường phức tạp.
Thay vì dựa vào các quy tắc đã được định nghĩa trước, AI liên tục tinh chỉnh một phương pháp mới để cập nhật các chính sách và dự đoán. Khi được thử nghiệm trên tiêu chuẩn Atari cổ điển - một bộ trò chơi video được sử dụng để đánh giá hiệu suất RL - thuật toán được phát hiện không chỉ vượt qua các quy tắc do con người thiết kế mà còn xuất sắc trong các nhiệm vụ hoàn toàn mới, đầy thách thức mà nó chưa bao giờ gặp phải trong quá trình đào tạo.
Không phải là một cải tiến từng bước, mà là một sự chuyển đổi khái niệm. AI có thể tăng tốc tiến bộ trong các lĩnh vực yêu cầu trí tuệ thích ứng, từ robot đến khám phá khoa học.
Bằng cách tự động hóa quy trình phát hiện, chúng ta có thể sớm thấy các hệ thống AI tự khởi động những tiến bộ của riêng chúng, giảm thiểu sự can thiệp của con người và có khả năng dẫn đến trí tuệ nhân tạo mạnh mẽ và có thể tổng quát hơn.

Hàng đầu
Thứ hạng
Yêu thích

