跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+1.96%
USELESS
+5.57%
IKUN
+2.56%
gib
-5%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+4.49%
ALON
+0.28%
LAUNCHCOIN
-3.71%
GOONC
+4.42%
KLED
+1.24%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.7%
Boopa
+34.82%
PORK
+0.2%
主页
Albert Gu
助理教授@mldcmu。首席科学家@cartesia_ai。引领 SSM 革命。
查看原文
Albert Gu
2025年10月29日
对我们迄今为止最好的模型感到无比自豪。 感激能够与这样一支强大的研究团队合作,他们总是充满好奇,愿意探索未曾踏足的道路。
47.79K
326
Albert Gu
2025年10月20日
我真的很喜欢这个研究方向! 很长一段时间以来,我一直在谈论SSMs与Transformers之间的“脑与数据库”类比。我提到过的一个延伸观点是,当我们开始考虑构建多组件*系统*而不是单一模型时,权衡会发生变化。 例如,如果有人认同这样的直觉:现代混合模型将SSM作为主要的“类脑”处理单元,而注意力主要用于“类数据库”的缓存,以帮助精确检索,那么我假设一个更优的系统可能是一个纯SSM语言模型,结合明确的外部知识数据库和上下文缓存。这更类似于人类智能,主要由大脑(一个SSM)驱动,辅以外部知识库(书籍、互联网)和工具使用。 这篇论文显示了相当有趣的结果,SSMs在这种交互式工具使用的代理模型中似乎表现得非常优越于Transformers。很高兴看到这个直觉得到了验证,希望更多的研究能继续沿着这些方向进行!
Eran Malach
2025年10月17日
SSM承诺在长上下文中实现高效的语言建模,但到目前为止,在许多设置中似乎表现不如Transformer。我们的新研究表明,这并不是SSM的问题,而是我们目前使用它们的方式存在问题。 Arxiv: 🧵
63.74K
540
热门
排行
收藏