热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我在谷歌DeepMind工作了8年后离开了。许多美好的回忆——从谷歌大脑的早期基础论文(与 @noamshazeer @ashvaswani @lukaszkaiser 合作的图像变换器、Tensor2Tensor、Mesh TensorFlow)到领导Gemini后期评估,赶上并在100天内发布,然后带领团队跃升至LMArena #1(并保持超过一年!),最后为Gemini的IMO和ICPC金牌(与 @HengTze @quocleix 合作)进行令人难以置信的推理创新。
Gemini的旅程从一个范式到另一个范式:首先,重塑我们的LaMDA模型(第一个类似指令的聊天机器人!),从一个实际的聊天机器人转变为具有RLHF的长内容响应;然后,通过训练长思维链、新环境和奖励头进行推理和深度思考。当我们第一次开始时,公众情绪很差。每个人都认为谷歌注定要因其搜索遗产和组织政治而失败。现在,Gemini在用户偏好中始终排名第一,并引领新的科学成就,大家都认为谷歌获胜是显而易见的。😂(过去,OpenAI会通过在我们之前宣布每个新的谷歌发布来抢占AI新闻周期;可以肯定地说,那些想法的积压已经清空。)
我随后加入了xAI。这个配方是众所周知的。计算、数据和O(100)个聪明、勤奋的人是获得前沿级LLM所需的一切。xAI *真的*相信这一点。对于计算,即使在谷歌,我也从未体验过如此多的人均芯片(& 100K+ GB200/300K的芯片正在与Colossus 2到来)。对于数据,Grok 4在扩展RL和后期训练方面做出了最大的赌注。xAI正在进行新的赌注,以扩展数据、深度思考和训练配方。团队反应迅速。没有公司能在如此短的时间内达到xAI今天在AI能力上的水平。正如@elonmusk所说,一家公司的第一和第二阶导数是最重要的:xAI的加速是最高的。
我很高兴地宣布,在我工作的头几周,我们推出了Grok 4 Fast。Grok 4是一个令人惊叹的推理模型,仍然在ARC-AGI和FinSearchComp等新基准上名列前茅。但它速度较慢,并且从未真正针对通用用户需求。Grok 4 Fast是最佳的迷你类模型——在LMArena上,它排名第8(Gemini 2.5 Flash排名第18!),在AIME等核心推理评估中,它与Grok 4不相上下,同时便宜15倍。感谢 @LiTianleli @jinyilll @ag_i_2211 @s_tworkowski @keirp1 @yuhu_ai_
热门
排行
收藏