跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
DEX API
探索 DEX API
DEX API 文档
API Key 管理
区块链浏览器
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+3.49%
USELESS
+9.31%
IKUN
-0.39%
gib
+3.47%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+2.34%
ALON
-2.22%
LAUNCHCOIN
+0.67%
GOONC
+10.05%
KLED
-8.44%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+2.05%
Boopa
+0.36%
PORK
0.00%
主页
Bryan Kim
人工智能应用投资@a16z |@elevenlabsio、@function、@cluely、@trymirage、@slingshotai_inc、@partiful等领域的投资者 |增长@Snap和首席财务官@livebungalow
查看原文
Bryan Kim
20 小时前
.@deepseek_ai OCR 论文 - 我作为一个不太懂技术的人,试图更好地理解这个 😅 我从 ChatGPT 那里得到的理解是,它用乐高积木作为类比,这让我立刻明白了。
Andrej Karpathy
20 小时前
我非常喜欢新的 DeepSeek-OCR 论文。这是一个不错的 OCR 模型(可能比 dots 差一点),是的,数据收集等等,但无论如何这并不重要。 对我来说,更有趣的部分(尤其是作为一个内心深处是计算机视觉的人,暂时伪装成自然语言专家)是像素是否比文本更适合输入到 LLMs。文本标记是否浪费且糟糕,作为输入。 也许更合理的是,所有输入到 LLMs 的内容应该永远只是图像。即使你碰巧有纯文本输入,也许你会更愿意将其渲染后再输入: - 更多的信息压缩(见论文)=> 更短的上下文窗口,更高的效率 - 显著更多的通用信息流 => 不仅仅是文本,例如粗体文本、彩色文本、任意图像。 - 输入现在可以轻松地以双向注意力处理,并作为默认,而不是自回归注意力 - 强大得多。 - 删除分词器(在输入时)!!我已经抱怨过我有多不喜欢分词器。分词器很丑,分离,不是端到端的阶段。它“引入”了 Unicode、字节编码的所有丑陋,它继承了很多历史包袱,安全/越狱风险(例如,续续字节)。它使得两个在视觉上看起来相同的字符在网络内部看起来像两个完全不同的标记。一个微笑的表情符号看起来像一个奇怪的标记,而不是一个... 实际的微笑面孔,像素和所有的转移学习都带来了。分词器必须去。 OCR 只是许多有用的视觉 -> 文本任务之一。而文本 -> 文本任务可以被转化为视觉 -> 文本任务。反之则不然。 所以用户消息是图像,但解码器(助手的响应)仍然是文本。如何现实地输出像素就不那么明显了……或者你是否想这样做。 现在我还得抵制冲动,想要制作一个仅限图像输入的 nanochat 版本...
2.73K
10
Bryan Kim
10月21日 02:47
疯狂。等他摆脱它的时候吧
fabian
10月21日 02:31
我对我在 Glif 上构建的这个新的特效代理着迷,它可以使用你手机的真实视频。 目标是成为创作者的强大魔法棒,但足够简单,让我 7 岁的孩子也能使用。 只需上传你的视频并告诉它你想要什么。 代理是新的应用程序。
5.85K
14
Bryan Kim
10月21日 02:04
.@SaanyaOjha 在 @sama 的播客上发布的 LinkedIn 帖子,来自上周。 “让战术成为战略。” OpenAI 的研发是达尔文式的。发货混乱,观察秩序,扩展变异。记忆并不是作为护城河而构思的——用户让它成为了护城河。奥特曼的天才不在于预见;而在于反馈。
2.15K
14
热门
排行
收藏