一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX | OKX Wallet

發現功能使用指南

discoveryBanners

熱門話題

#

Bonk 生態迷因幣展現強韌勢頭

#

有消息稱 Pump.fun 計劃 40 億估值發幣，引發市場猜測

LAUNCHCOIN-40.63%

#

Solana 新代幣發射平臺 Boop.Fun 風頭正勁

header

AMD

我們一起advance_

AMD

AMD2025年10月29日

監督式微調、強化學習人類反饋、LoRA。真實的技能，應用於現實世界的AI。在這門新的@DeepLearningAI課程中，與AMD的@realSharonZhou學習如何微調和對齊大型語言模型(LLMs)。

Andrew Ng

Andrew Ng2025年10月29日

一門令人興奮的新課程：針對大型語言模型的微調與強化學習：後訓練入門，由 @realSharonZhou 主講，她是 @AMD 的 AI 副總裁。現在可以在這裡獲得。後訓練是前沿實驗室用來將基礎大型語言模型（在大量未標記文本上訓練以預測下一個單詞/標記的模型）轉變為能夠遵循指令的有用、可靠助手的關鍵技術。我也看到許多應用中，後訓練將僅在 80% 時間內運作的演示應用轉變為一個穩定的系統，能夠持續表現。這門課程將教你最重要的後訓練技術！在這個 5 模組的課程中，Sharon 將帶你了解完整的後訓練流程：監督微調、獎勵建模、強化學習人類反饋（RLHF）以及像 PPO 和 GRPO 的技術。你還將學會如何使用 LoRA 進行高效訓練，以及設計評估以在部署前後捕捉問題。你將獲得的技能： - 應用監督微調和強化學習（RLHF、PPO、GRPO）來使模型與期望行為對齊 - 使用 LoRA 進行高效微調，而無需重新訓練整個模型 - 準備數據集並生成合成數據以進行後訓練 - 理解如何操作大型語言模型的生產流程，並設置進行/不進行的決策點和反饋循環這些先進的方法不再僅限於前沿 AI 實驗室，現在你也可以在自己的應用中使用它們。在這裡學習：

24.36K

AMD

AMD2025年10月28日

阿聯酋在安全的端到端 AI 基礎設施方面邁出了重要的一步。與 @Cisco 和 @G42ai 一起，我們正在利用 AMD Instinct MI350X 加速器推動下一代 AI 創新，以促進美國-阿聯酋 AI 加速夥伴關係。閱讀更多：

18.07K

AMD

AMD2025年10月28日

美國的 AI 堆疊，由 AMD 提供動力。我們與 @ENERGY、@ORNL、@HPE 和 @OracleCloud 一起，自豪地宣布 AMD 正在幫助推進科學的規模。隨著 AMD Instinct GPU 和 EPYC CPU 成為國家最新超級計算機和 AI 工廠 Discovery 和 Lux 的核心，美國準備繼續引領 AI 創新。

36.47K

熱門

排行

收藏

©2017 - 2025 WEB3.OKX.COM

繁體中文简体中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

關於 OKX Wallet

下載學院關於我們就業機會聯繫我們服務條款隱私政策 X (原推特)

產品

行情幣幣兌換市場賺幣發現開發者中心瀏覽器安全

用戶支持

幫助中心官方渠道驗證公告 DEX 費率標準加入社群比特幣錢包以太坊錢包 Solana 錢包