跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-8.89%
USELESS
-6.98%
IKUN
-4.26%
gib
-13.77%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-6.48%
ALON
+6.66%
LAUNCHCOIN
+5.17%
GOONC
-18.38%
KLED
-10.73%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+0.15%
Boopa
-10.5%
PORK
+0.35%
主頁
Techmeme
來自全網的技術領導者的頭條新聞和評論。 此帳戶共用頂級Techmeme頭條新聞。請訪問我們的網站以獲取完整背景資訊。
查看原文
Techmeme
10月14日 01:35
Andrej Karpathy 揭示了 nanochat,這是一個在單一、依賴性最小的代碼庫中實現的全棧訓練和推理的 LLM。 📫 訂閱:
Andrej Karpathy
10月13日 23:16
很高興推出新的代碼庫:nanochat! (這是我寫過的最瘋狂的之一)。 與我之前的類似代碼庫nanoGPT僅涵蓋預訓練不同,nanochat是一個從零開始的簡單ChatGPT克隆的全棧訓練/推理管道,代碼庫依賴最小。你啟動一個雲GPU盒子,運行一個腳本,最少4小時後,你就可以在類似ChatGPT的網頁UI中與自己的LLM對話。 它大約有8000行我認為相當乾淨的代碼來: - 使用新的Rust實現訓練分詞器 - 在FineWeb上預訓練一個Transformer LLM,評估多個指標的CORE分數 - 在SmolTalk的用戶-助手對話中進行中期訓練,進行多選題,工具使用。 - SFT,評估聊天模型在世界知識多選題(ARC-E/C,MMLU)、數學(GSM8K)、代碼(HumanEval)上的表現 - 可選地在GSM8K上對模型進行RL,使用"GRPO" - 在引擎中高效推理模型,使用KV緩存,簡單的預填充/解碼,工具使用(輕量級沙箱中的Python解釋器),通過CLI或類似ChatGPT的WebUI與其對話。 - 撰寫一份單一的Markdown報告卡,總結並遊戲化整個過程。 即使成本低至約100美元(約4小時在8XH100節點上),你也可以訓練一個小型的ChatGPT克隆,能夠進行對話,並且可以寫故事/詩,回答簡單問題。約12小時超過GPT-2的CORE指標。當你進一步擴展到約1000美元(約41.6小時的訓練)時,它迅速變得更加連貫,能夠解決簡單的數學/代碼問題並參加多選測試。例如,一個深度30的模型訓練24小時(這大約等於GPT-3 Small 125M的FLOPs和GPT-3的1/1000)在MMLU上達到40分,在ARC-Easy上達到70分,在GSM8K上達到20分,等等。 我的目標是將完整的"強基線"堆棧整合成一個連貫、簡約、可讀、可駭客、最大限度可分叉的代碼庫。nanochat將是LLM101n的壓軸項目(該項目仍在開發中)。我認為它也有潛力發展成為一個研究工具或基準,類似於之前的nanoGPT。它絕不是完成的、調整過的或優化的(實際上我認為可能還有很多低垂的果實),但我認為它已經達到了一個整體框架足夠好的地方,可以上傳到GitHub,讓所有部分都可以改進。 代碼庫的鏈接和nanochat快速運行的詳細步驟在回覆中。
4.96K
4
Techmeme
10月10日 02:39
Kernel,幫助 AI 代理更有效地通過 Chrome 訪問互聯網,籌集了 2200 萬美元的種子輪和 A 輪資金,由 Accel 領投 (@shenlucinda / Axios) 📫 訂閱:
3.08K
7
Techmeme
10月5日 03:11
OpenAI 更新了 GPT-5 Instant,以更好地識別和支持處於困境中的人;ChatGPT 將把這些敏感對話部分路由到模型 (@openai) 📫 訂閱:
OpenAI
10月4日 06:07
我們正在更新 GPT-5 Instant,以更好地識別和支持在困境中的人們。 對話中的敏感部分將現在路由到 GPT-5 Instant,以快速提供更有幫助的回應。當用戶詢問時,ChatGPT 將繼續告訴用戶當前使用的模型。 今天開始向 ChatGPT 用戶推出。
6.65K
6
熱門
排行
收藏