跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-6.69%
USELESS
-2.74%
IKUN
-10.02%
gib
-11.31%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-2.76%
ALON
-6.03%
LAUNCHCOIN
+13.9%
GOONC
+1.7%
KLED
-5.43%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-1.57%
Boopa
+14.24%
PORK
-3.33%
主页
Akshay 🚀
为您简化 LLM、AI 代理、RAG 和机器学习!• 联合创始人 @dailydoseofds_• BITS Pilani • 3 项专利• 前 AI 工程师 @ LightningAI
查看原文
Akshay 🚀
11月26日 20:30
NVIDIA 刚刚发布了一篇论文,可能解决了 LLMs 中最大的权衡问题。 速度与质量。 自回归模型(如 GPT)聪明但速度慢 - 它们一次生成一个标记,导致大部分 GPU 处于闲置状态。 扩散模型速度快,但通常会产生不连贯的输出。 TiDAR 在一次前向传递中同时实现了这两者。 这里是聪明的部分: 现代 GPU 可以处理比我们实际使用的更多标记。TiDAR 利用这些 "空闲槽": 1. 使用扩散同时草拟多个标记("思考"阶段) 2. 使用自回归验证它们("对话"阶段) 这两者同时发生,使用智能注意力掩码 - 草拟时为双向,验证时为因果。 结果: ↳ 在 15 亿参数下速度快 4.71 倍,且没有质量损失 ↳ 在 80 亿参数下速度快近 6 倍 ↳ 首个超越推测解码(EAGLE-3)的架构 ↳ 与标准 KV 缓存兼容,不同于纯扩散模型 训练技巧也很聪明 - 他们不是随机掩盖标记,而是掩盖所有内容。这提供了更强的学习信号,并使单步草拟高效。 如果你正在构建实时 AI 代理,而延迟会影响体验,这个架构值得关注。 下一条推文中有论文链接。
70.41K
885
Akshay 🚀
11月26日 16:16
代理现在遇到了新的障碍! 而这并不是由于计算、内存或大型语言模型(LLMs)造成的! 我们花了几十年为阅读文档、理解上下文并能在出现问题时进行即兴发挥的开发者设计API。 然而,AI代理无法做到这些。它们需要完美的一致性、机器可读的所有内容,以及零歧义。 因此,大多数最初为人类设计的API现在对AI的使用非常糟糕。 而这个差距已经成为每个人的问题,因为AI代理现在是主要的API消费者。 @getpostman发布了一项API成熟度评估,解决了这个问题,他们今天与我合作撰写这篇文章,分享其内容。 它准确显示了您在6个关键维度上的位置: - 影响:API是否真正推动了业务成果? - 可发现性:代理能否找到您的API,更不用说有效使用它们了? - 质量:您是否有自动检查来捕捉在代理对您的系统进行攻击之前的问题? - 治理:是否有机器可以理解的一致结构? - 安全性:您能否处理AI代理发起的比人类多1000倍的调用? - AI准备度:机器能否像人类一样轻松使用您的API? 评估只需5分钟,准确显示了差距所在。 有趣的是,它如何将API成熟度与AI准备度直接联系起来。 现在不仅仅是拥有良好的API,而是拥有可以被下一代AI系统消费、理解和利用的API。 我与大多数团队交谈时,他们认为自己已经准备好了,因为他们有“良好的文档”。 但对人类来说好的并不等于对机器来说好。 我在回复中分享了一项评估。
19.38K
107
Akshay 🚀
11月25日 21:11
这里有一个重大的突破! 有人修复了 Jupyter Notebooks 中的每一个主要缺陷。 .ipynb 格式停留在 2014 年。它是为一个不同的时代而构建的——没有云协作,没有 AI 代理,没有团队工作流程。 更改一个单元格,你在 git diff 中会得到 50 多行 JSON 元数据。代码审查变成了一场噩梦。 想在多个笔记本之间共享数据库连接?在每个笔记本中单独配置。需要评论或权限?太糟糕了。 Jupyter 适合单人分析,但对于构建生产 AI 系统的团队来说却不适用。 Deepnote 刚刚开源了解决方案(Apache 2.0 许可证) 他们建立了一种新的笔记本标准,真正适合现代工作流程: ↳ 可读性强的 YAML - Git diff 显示实际的代码更改,而不是 JSON 噪音。代码审查终于有效了。 ↳ 基于项目的结构 - 多个笔记本共享集成、机密和环境设置。配置一次,随处使用。 ↳ 23 个新块 - SQL、交互式输入、图表和 KPI 作为一等公民。构建数据应用,而不仅仅是分析笔记本。 ↳ 多语言支持 - 在一个笔记本中使用 Python 和 SQL。现代数据工作不再是单一语言。 ↳ 完全的向后和向前兼容性:用一个命令将任何 Jupyter 笔记本转换为 Deepnote,反之亦然。 npx @ deepnote/convert notebook.ipynb 然后在 VS Code、Cursor、WindSurf 或 Antigravity 中打开它。你现有的笔记本会立即迁移。 他们的云版本增加了实时协作,带有评论、权限和实时编辑。 我在回复中分享了 GitHub 仓库链接! 它是 100% 开源的。
31.19K
223
热门
排行
收藏