跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+1.79%
USELESS
-7.15%
IKUN
-1.43%
gib
+3.93%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+1.36%
ALON
-3.71%
LAUNCHCOIN
-13.15%
GOONC
+6.24%
KLED
+1.98%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-1.74%
Boopa
-1.04%
PORK
+17.82%
主頁
汉松
大廠大模型應用開發 | AI 降臨派 | 終身學習者 | Taste is all you need
查看原文
汉松
10月19日 21:31
從零實現 vLLM 的第四篇文章,我們將目光轉向 Transformer 架構中另一個看似簡單、卻至關重要的組件:RMSNorm(均方根歸一化)。 我們先來看看什麼是歸一化,假設你剛考完期末考試,三門課的成績出來了: 數學:120分(滿分150) 英語:80分(滿分100) 物理:160分(滿分200) 哪門課考得最好?如果你直接比較 120、80、160,會得出物理最好的結論。但真實情況是:三門課其實考得一樣好。 數學:120/150 = 80% 英語:80/100 = 80% 物理:160/200 = 80% 這就是歸一化的核心思想:把不同量綱、不同範圍的數據轉換到統一的標準下進行比較。 為什麼神經網絡需要歸一化? 想象一下,你在玩傳話遊戲。第一個人說"我喜歡蘋果",傳到第十個人那裡變成了"我喜歡菠蘿"。這就是深度神經網絡面臨的問題。 每一層網絡都會對輸入做一些計算,然後把結果傳給下一層。問題是,隨著層數增加,這些數值會變得越來越不可控——要麼爆炸式增長,要麼消失得無影無蹤。就像傳話遊戲一樣,信息在傳遞過程中逐漸失真。 在模型中加入歸一化層,能夠降低梯度爆炸或者消失的概率,模型的訓練過程變得更加穩定。歸一化技術從一開始的 BatchNorm 先演進到 LayerNorm,最後進化到了 RMSNorm,成為大模型的標配。 我的文章會帶大家走進歸一化技術的演進史,感興趣的可以查看原文。
63.94K
231
汉松
10月17日 11:44
Claude 的 Agent Skills 本質上是一種“上下文卸載”,把冗長的技能信息移出上下文,按需加載。巧的是最近 Manus 的 Peak 也分享一些“上下文卸載”的技巧。Manus 有很多工具,但是並不會把這些工具的完整定義告訴模型。那它怎麼知道有哪些工具,又怎麼調用它們呢?想象一下,給你一臺新電腦,你怎麼知道有哪些工具能用?普通用戶會打開應用程序的列表,程序員會 `ls /usr/bin` 看一下有哪些命令可以用。 同樣的,Manus 的解法是在系統提示詞中,告訴模型在某個特定文件夾裡,有許多預裝的命令行實用工具。那些最常用的工具(ls、grep、cat、less、more等),就默認內置在系統提示裡面的。不需要告訴模型如何使用這些工具,只需要列出工具名,然後告訴它可以使用 --help 參數來瞭解如何使用工具。最妙的是這些 shell 操作模型都是學過的,所以它的泛化能力很強,要加新的工具只需要往文件夾裡面放一個命令就行。 我發現 Manus 真的是把 Unix 哲學貫徹到底了:KISS(Keep It Simple, Stupid)。
宝玉
10月17日 02:58
Agent Skills 是很好的東西,可以引導 Agent 獲取某些技能,而且製作起來很方便。 製作一個技能,就好像給新員工寫一份入職手冊。不需要為每一個不同任務都專門打造一個獨立的智能體,而是只要共享特定領域的專業知識,任何人都可以快速將智能體變成對應領域的高手。 我之前提到過朋友做一個基於他們 Design System 的 Agent,需要通過提示詞引導 Agent 去 grep 檢索文檔,現在就更簡單了,只要在全局或者項目目錄下的 .claude/skills 下面添加目錄,並且放一個包含meta信息的 SKILL\.md 文件,就可以引導 Agents 去學習使用這些 Skill。 官方也給了一個例子就是 PDF Skill,就是包含了一系列 PDF 操作的說明和腳本,Agent 藉助這些腳本,就可以操作 PDF,比如提取表單之類。也就是說 Skill 不僅可以包含文檔,還可以包含可執行的腳本。 需要注意的是 Skill 裡面的 Meta 信息是默認會加載到上下文文的,其餘信息用到才會加載。
136.52K
251
熱門
排行
收藏