跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-5.81%
USELESS
-6.93%
IKUN
-6.13%
gib
+4.86%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-2.58%
ALON
-5.23%
LAUNCHCOIN
-6.23%
GOONC
-2.98%
KLED
+4.96%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.02%
Boopa
-3.09%
PORK
0.00%
主页
Taelin
种类 / 弯曲 / HVM / INets / λ微积分
查看原文
Taelin
2 小时前
我也有同样的印象。恐怕我每天还有一些重要的事情是GPT-10即使用100万亿美元训练也无法做到的。
Colin Fraser
11月28日 07:34
也许,但也许看起来是这样的
619
12
Taelin
11月28日 19:39
这里没有新东西,只是一个使用AI进行研发的快速案例示例。 (GPT-5.1与Opus 4.5) 背景: 我们有两个版本的HVM可以运行SupGen: → HVM3:用于开发,达到160m交互/秒 → HVM4:精致版本,达到130m交互/秒 也就是说,新版本更现代,但稍微慢一些,因为我们还没有对其进行优化。 昨天,我启动了两个编码代理:Opus 4.5(ultrathink)和GPT-5.1-codex-max(xhigh),并要求他们尽可能优化新的HVM4。 结果:几个小时后,他们完全失败了。 甚至没有+1%。 然后我让他们继续尝试。 他们又失败了。又失败了。几个小时。 在某个时刻,他们只是放弃了。 他们甚至拒绝继续尝试。 GPT-5写道: > 我尝试了多种结构和低级更改,旨在减少内存流量并提高吞吐量,但每次尝试要么破坏了构建,要么导致性能回退,或者未能改善超过~120 M itrs/s的基线。 > 鉴于固定的clang -03约束和该工作负载的内存绑定特性,我目前没有可行的更改可以安全地推向140 M itrs/s。继续“只是继续尝试”可能会产生更多的回退,而不是实际的收益。 所以,我尝试了不同的方法:这次,我将旧的HVM3目录复制/粘贴到HVM4中,并写道: 这些是旧的和新的HVM实现。旧的实现包含一些新的实现尚未实现的优化。你的目标是理解差异并将旧实现中的所有优化移植到新架构中。 把这个发给Opus。 10分钟后,我检查了终端。 “每秒190m交互” 那是……相当令人高兴的景象,因为这是这个基准的绝对记录。我们从未在单核CPU中见过接近这样的表现。 这加强了我对LLM状态的看法: → 它们在编码方面非常出色。 → 它们在创新方面非常糟糕。 这两个模型完全无法提出我们所做的想法,但一旦注入了解决方案,它们在实现它、阅读和编写大量代码方面非常有能力,这节省了很多时间。HVM3中最重要的优化现在已经在新架构上实现,达到了新记录,而我根本不需要编码任何东西。我只需要想到这样做,它就像魔法一样有效。 为了记录,我已经完全停止使用Gemini 3。我认为它是世界上最聪明的模型,但由于糟糕的指令跟随、许多连接错误和延迟,以及Gemini CLI表现不佳,它并不适合编码。GPT-5.1-codex-max还不错,但速度较慢,我还没有看到它超越Opus 4.5,而Opus 4.5又是我所有事情的模型。我喜欢Claude模型在编码方面一直以来的稳定性,我很高兴有一个实际上也聪明的模型。
68.5K
690
Taelin
11月26日 02:31
我只是想记录一下,今天我参加了@FilipeDeschamps的编程秀,结果在最初的问题中就被淘汰了,因为我不知道编程的*基本*概念(而且我还让聊天区的人因为我回答慢而愤怒 😭),但还是有人把我当作聪明人。 我希望这件事能就此解决 :3
68.31K
494
热门
排行
收藏