跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+2.47%
USELESS
-10.97%
IKUN
-8.95%
gib
-5.09%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-1.47%
ALON
-3.81%
LAUNCHCOIN
-12.27%
GOONC
-34.66%
KLED
+15.2%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-3.08%
Boopa
-3.56%
PORK
+10.15%
主頁
Nathan Barry
知識盜竊狂。之前@Apple,CS + 數學@UTAustin,@zfellows
查看原文
Nathan Barry
10月23日 01:24
正在嘗試訓練一個小型的 11M 參數字符級文本擴散模型! 這是一個正在進行中的項目,但目前的代碼是對 nanochat gpt 實現的重度修改版(將自回歸解碼更改為擴散),並且是基於 Tiny Shakespeare 數據集進行訓練的。 簡單的遮罩計劃實現是對每個迭代中的每個標記使用均勻的遮罩概率。更新的方法是從左到右以塊狀進行遮罩,這樣可以提高輸出質量並允許某些 KVCache 的重用。 我意識到在生成過程中實際上可以以任何任意方式應用遮罩。下面你可以看到我根據康威的生命遊戲的規則應用了遮罩。 我想知道是否有任何不尋常的遮罩策略可以提供好處。無論如何,這是一種非常有趣且令人著迷的方式來破壞和變形文本。
106.37K
1.72K
Nathan Barry
10月21日 00:52
BERT 只是一個單一的文本擴散步驟! (1/n) 當我第一次讀到語言擴散模型時,我驚訝地發現它們的訓練目標只是掩蔽語言模型(MLM)的概括,這是我們自 2018 年以來一直在做的事情。 我第一個想到的問題是:"我們能否微調一個類似 BERT 的模型來進行文本生成?"
571.48K
815
Nathan Barry
10月17日 08:25
研究日誌 第0天:DiLoCo日 我決定圍繞分散式低通訊訓練撰寫論文。基本上,我們如何能夠在分散的節點上有效地訓練大型模型,而不會被網路延遲和帶寬完全摧毀? (1/n)
797
6
熱門
排行
收藏