跳转至主要内容
币币兑换
行情
扫链
追踪
信号
牛人榜
资产
更多
产品
DeFi
Cryptoverse
奖励中心
市场
洞察中心
Eco Hub
邀请计划
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
探索 Web3 Giveaway 活动,每周丰厚奖励等您来领取
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-14.11%
USELESS
+0.46%
IKUN
+19.04%
gib
-1.57%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+4.49%
ALON
-8.5%
LAUNCHCOIN
-7.18%
GOONC
-17.61%
KLED
-9.95%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-1.35%
Boopa
-7.66%
PORK
-3.47%
主页
Awni Hannun
人工智能@apple
更多
查看原文
Awni Hannun
19 小时前
GPT-OSS 使用 MXFP4 量化(MLX 现在支持)。 目前有两种 FP4 格式在流通:MXFP4 和 NVFP4(NV 代表 Nvidia)。 从 GPT-OSS 使用 MXFP4 的方式来看,它有些不够优化。我认为 NVFP4 将是未来更常用的格式。 更多细节如下: 这两种格式将权重量化为 4 位浮点数(e2 m1),每组有一个独特的缩放比例。 区别在于组大小和每组的缩放比例编码方式。 - MXFP4 使用 e8m0 缩放(定点,8 位),组大小为 32。在乘以权重之前,它会被提升到 2 的幂。 - NVFP4 使用 e4m3(fp8)缩放,组大小为 16。它直接与权重相乘。 MXFP4 中的缩放编码相当不够优化,因为它没有很多我们需要的值的表示。 事实上,如果你查看 GPT-OSS 的缩放分布,它极其集中在仅几个值周围。例如,对于我正在查看的第二个 MoE 层,只有 8/256 个可能的值被使用。(见图)。
更多
14.89K
182
Awni Hannun 已转发
Gheorghe Iuga
8月27日 22:40
确实。MLX远不止于LLM推理。 对于这个DTM工作负载,MLX的吞吐量约为NumPy的8.8倍(延迟降低约89%) 用于梁挠度分析的差分变换方法(DTM)。
更多
3.83K
33
Awni Hannun 已转发
Prince Canuma
8月27日 01:51
介绍 Marvis-TTS 🔥🚀 这是一个由 @lllucas 和我构建的新型本地优先 TTS 模型,旨在提高效率、可访问性和在消费者设备(如 Apple Silicon、iPhone、iPad 等)上的实时性能。 传统的 TTS 模型通常需要完整的文本输入,或者牺牲实时能力,而 Marvis 则颠覆了这一点。它在处理文本时流式传输音频块,创造出真正的对话体验。 不再有尴尬的停顿或不自然的断裂——Marvis 智能地处理整个文本上下文,以提供连贯、富有表现力的语音。 今天就开始吧: > pip install -U mlx-audio
更多
42.46K
397
热门
排行
收藏
PumpSwap
DEX
AutoShark Finance
DeFi
Pancake Swap
DeFi
DEX
质押
Yield
4
0x Protocol
DeFi
DEX
5
OKX DEX
DEX
6
MarginFi
DeFi
7
Transit Swap
DEX
8
1inch Network
DeFi
DEX
流动性池
9
Galxe
其他
10
Gelato Network
DeFi