2025年最大的AI使用报告刚刚发布(在OpenRouter上有100万亿个真实使用的token) 我最惊讶的8个发现: 1. 角色扮演和创意小说是第二大类别,超过50%的所有开源使用。未审查的模型正在吞噬对“粉丝小说”和NSFW内容的需求。 2. 编程现在占所有LLM token的超过50%。一年前是11%。编码实际上已经成为AI的操作系统。 3. Anthropic的Claude用于超过80%的编程,几乎没有角色扮演。它是“严肃工作”模型,而DeepSeek是娱乐之王(角色扮演流量占2/3) 4. 第一个成功应对痛苦工作负载的模型会创造近乎永久的锁定。2025年初的Claude 4 Sonnet和Gemini 2.5 Pro的用户在六个月后仍保留40-50%,而每个后续的群体都在流失。 他们称之为玻璃鞋效应:成为第一个适应新工作负载的模型,公主就永远不会离开。 5. 需求极其缺乏价格弹性。如果Claude或GPT-5能为用户节省十分钟的调试时间,他们乐意为每个token支付10-50倍的价格。便宜根本不够。 6. 新的最佳模型规模是20-70B参数。小模型的使用率低,巨型模型正在分化,而中等规模的模型正在吞噬两者。 7. 开源模型在一年内从<5%上升到约33%的总使用量,几乎完全由中国实验室(DeepSeek、Qwen、Moonshot、MiniMax)推动。现在没有单一的最佳模型。按使用量排名的前十个模型来自八个不同的实验室。 8. 亚洲现在占全球支出的31%(一年前为13%)。新加坡+中国+韩国单独占所有token的近20%。 一个基础模型统治所有的时代已经结束。我们现在生活在一个永久分散的世界中,你使用的模型完全取决于你在做什么——写代码?写粉丝小说? 无论如何,token支出的方向显然只有一个:向上和向右 完整报告来自@a16z + @OpenRouterAI(链接在评论中)。