一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

我在谷歌DeepMind工作了8年后离开了。许多美好的回忆——从谷歌大脑的早期基础论文（与 @noamshazeer @ashvaswani @lukaszkaiser 合作的图像变换器、Tensor2Tensor、Mesh TensorFlow）到领导Gemini后期评估，赶上并在100天内发布，然后带领团队跃升至LMArena #1（并保持超过一年！），最后为Gemini的IMO和ICPC金牌（与 @HengTze @quocleix 合作）进行令人难以置信的推理创新。 Gemini的旅程从一个范式到另一个范式：首先，重塑我们的LaMDA模型（第一个类似指令的聊天机器人！），从一个实际的聊天机器人转变为具有RLHF的长内容响应；然后，通过训练长思维链、新环境和奖励头进行推理和深度思考。当我们第一次开始时，公众情绪很差。每个人都认为谷歌注定要因其搜索遗产和组织政治而失败。现在，Gemini在用户偏好中始终排名第一，并引领新的科学成就，大家都认为谷歌获胜是显而易见的。😂（过去，OpenAI会通过在我们之前宣布每个新的谷歌发布来抢占AI新闻周期；可以肯定地说，那些想法的积压已经清空。）我随后加入了xAI。这个配方是众所周知的。计算、数据和O(100)个聪明、勤奋的人是获得前沿级LLM所需的一切。xAI *真的*相信这一点。对于计算，即使在谷歌，我也从未体验过如此多的人均芯片（& 100K+ GB200/300K的芯片正在与Colossus 2到来）。对于数据，Grok 4在扩展RL和后期训练方面做出了最大的赌注。xAI正在进行新的赌注，以扩展数据、深度思考和训练配方。团队反应迅速。没有公司能在如此短的时间内达到xAI今天在AI能力上的水平。正如@elonmusk所说，一家公司的第一和第二阶导数是最重要的：xAI的加速是最高的。我很高兴地宣布，在我工作的头几周，我们推出了Grok 4 Fast。Grok 4是一个令人惊叹的推理模型，仍然在ARC-AGI和FinSearchComp等新基准上名列前茅。但它速度较慢，并且从未真正针对通用用户需求。Grok 4 Fast是最佳的迷你类模型——在LMArena上，它排名第8（Gemini 2.5 Flash排名第18！），在AIME等核心推理评估中，它与Grok 4不相上下，同时便宜15倍。感谢 @LiTianleli @jinyilll @ag_i_2211 @s_tworkowski @keirp1 @yuhu_ai_