Báo cáo sử dụng AI lớn nhất năm 2025 vừa được công bố (100 triệu tỷ token sử dụng thực tế trên OpenRouter) 8 phát hiện mà tôi cảm thấy bất ngờ nhất: 1. Vai trò và tiểu thuyết sáng tạo là danh mục lớn thứ 2 và >50% tổng số sử dụng mã nguồn mở. Các mô hình không bị kiểm duyệt đang hấp thụ nhu cầu cho nội dung "fan-fic" và NSFW. 2. Lập trình hiện chiếm >50% tổng số token LLM. Nó chỉ chiếm 11% mười hai tháng trước. Lập trình thực sự đã trở thành hệ điều hành của AI. 3. Claude của Anthropic được sử dụng cho >80% lập trình và gần như không có vai trò nào. Nó là mô hình "công việc nghiêm túc" trong khi DeepSeek là vua giải trí (với 2/3 lưu lượng truy cập vai trò) 4. Một mô hình mà người đầu tiên nắm bắt một khối lượng công việc đau đớn tạo ra sự khóa chặt gần như vĩnh viễn. Các nhóm đầu năm 2025 của Claude 4 Sonnet và Gemini 2.5 Pro vẫn giữ lại 40–50% người dùng sau sáu tháng trong khi mọi nhóm sau đó đều bị churn. Họ gọi đó là hiệu ứng Giày Thủy Tinh: hãy là người đầu tiên phù hợp với một khối lượng công việc mới, và công chúa sẽ không bao giờ rời đi. 5. Nhu cầu cực kỳ không nhạy cảm với giá cả. Người dùng sẵn sàng trả 10–50× nhiều hơn cho mỗi token cho Claude hoặc GPT-5 nếu nó tiết kiệm cho họ mười phút gỡ lỗi. Việc rẻ tiền không đủ. 6. Kích thước mô hình điểm ngọt mới là 20–70B tham số. Các mô hình nhỏ đang có mức sử dụng thấp, các mô hình khổng lồ đang bị phân mảnh, và tầng trung đang ăn cả hai. 7. Các mô hình mã nguồn mở đã tăng từ <5% lên ~33% tổng số sử dụng trong một năm, hầu như hoàn toàn do các phòng thí nghiệm Trung Quốc (DeepSeek, Qwen, Moonshot, MiniMax) thúc đẩy. Không còn một mô hình tốt nhất nào nữa. Mười mô hình hàng đầu theo khối lượng đến từ tám phòng thí nghiệm khác nhau. 8. Châu Á hiện chiếm 31% chi tiêu toàn cầu (trước đây là 13% một năm trước). Singapore + Trung Quốc + Hàn Quốc một mình đã chiếm gần 20% tổng số token. Thời đại của một mô hình nền tảng để thống trị đã kết thúc. Chúng ta hiện sống trong một thế giới vĩnh viễn phân mảnh, nơi mô hình bạn sử dụng hoàn toàn phụ thuộc vào những gì bạn đang làm với nó - viết mã? viết fanfics? Dù sao, rõ ràng chỉ có một hướng cho chi tiêu token: Lên và về phía bên phải Báo cáo đầy đủ từ @a16z + @OpenRouterAI (liên kết trong bình luận).