O maior relatório de uso de IA de 2025 acaba de ser lançado (100 trilhões de tokens de uso real no OpenRouter) 8 descobertas que mais me surpreenderam: 1. Roleplay e ficção criativa são a 2ª maior categoria e >50% de todo o uso de código aberto. Modelos não censurados estão absorvendo a demanda por "fan-fic" e conteúdo NSFW. 2. Programação agora representa >50% de todos os tokens LLM. Era 11% há doze meses. A codificação literalmente se tornou o sistema operacional da IA. 3. O Claude da Anthropic é usado para >80% da programação e quase zero de roleplay. É o modelo de “trabalho sério”, enquanto o DeepSeek é o rei do entretenimento (com 2/3 do tráfego de roleplay) 4. Um modelo que é o primeiro a dominar uma carga de trabalho dolorosa cria um bloqueio quase permanente. As coortes do início de 2025 do Claude 4 Sonnet e Gemini 2.5 Pro ainda retêm 40–50% dos usuários seis meses depois, enquanto todas as coortes posteriores têm alta rotatividade. Eles chamam isso de efeito Glass Slipper: seja o primeiro a se adaptar a uma nova carga de trabalho, e a princesa nunca vai embora. 5. A demanda é extremamente inelástica em relação ao preço. Os usuários pagam felizmente de 10 a 50 vezes mais por token para Claude ou GPT-5 se isso economizar dez minutos de depuração. Ser barato está longe de ser suficiente. 6. O novo tamanho ideal do modelo é de 20 a 70 bilhões de parâmetros. Modelos pequenos estão recebendo baixo uso, modelos gigantes estão se fragmentando, e a faixa média está consumindo ambos. 7. Modelos de código aberto passaram de <5% para ~33% do uso total em um ano, quase inteiramente impulsionados por laboratórios chineses (DeepSeek, Qwen, Moonshot, MiniMax). Não há mais um único melhor modelo. Os dez melhores modelos por volume são de oito laboratórios diferentes. 8. A Ásia agora representa 31% do gasto global (era 13% há um ano). Singapura + China + Coreia sozinhas representam quase 20% de todos os tokens. A era de um modelo de fundação para governá-los acabou. Agora vivemos em um mundo permanentemente fragmentado onde o modelo que você usa depende inteiramente do que você está fazendo com ele - escrevendo código? escrevendo fanfics? De qualquer forma, claramente há apenas uma direção para o gasto em tokens: Para cima e para a direita Relatório completo de @a16z + @OpenRouterAI (link nos comentários).