Análise do Algoritmo de Recomendação do X ===================================== Utilizou-se o Grok Code Fast para obter uma visão rápida do sistema de recomendações do X. O Que Faz um Post Viralizar =========================== tldr: A previsão de engajamento supera tudo. Publique conteúdo que gere interações. Com base no código real do algoritmo, os posts que geralmente têm melhor classificação apresentam: + Altas pontuações de engajamento previstas (modelos de ML preveem curtidas/reposts/respostas) + Forte correspondência de personalização (similaridade do SimClusters com os interesses do usuário) + Relevância do gráfico social (conexões do RealGraph com a rede do usuário) + Conteúdo de mídia (imagens/vídeos recebem multiplicadores de engajamento) + Credibilidade do autor (contagem de seguidores, verificação, pontuação tweepcred) + Sinais de qualidade do conteúdo (passa filtros de spam/NSFW/qualidade) + Relevância oportuna (fator de frescor, tópicos em alta) + Potencial de conversa (altas pontuações de previsão de resposta) O algoritmo utiliza modelos de aprendizado de máquina para prever o engajamento, não fórmulas ponderadas simples. O sucesso é medido por interações reais dos usuários, criando um ciclo de feedback que melhora continuamente as previsões de classificação. Como o Algoritmo Funciona na Prática ==================================== 1. Geração de Candidatos (9 fontes): - Earlybird (posts na rede) ~50% - UTEG (recomendações fora da rede) - postMixer, Listas, Comunidades, Exploração de Conteúdo - Fontes Estáticas, em Cache, de Backfill 2. Hidratação de Recursos (~6000 recursos por post): - Recursos do usuário (interesses, comportamento, demografia) - Recursos do post (texto, mídia, metadados, engajamento) - Recursos de gráfico (SimClusters, RealGraph, conexões sociais) - Sinais em tempo real (engajamento atual, status em alta) 3. Pipeline de Pontuação (4 modelos): - Pontuação do Modelo (classificador pesado NAVI) - Pipeline de Reclassificação - Pontuação Heurística - Pontuação de Baixo Sinal 4. Filtragem (24 filtros no total): - 10 Filtros Globais (idade < 48h, deduplicação, localização, etc.) - 14 Filtros de Pontuação de Post (segurança do Grok, idioma, duração do vídeo, etc.) 5. Seleção Final & Mistura: - Classificar por pontuações finais - Aplicar regras de diversidade - Misturar com anúncios, quem seguir, prompts - Gerar linha do tempo Modelos de Previsão Chave ========================= O algoritmo prevê esses tipos de engajamento: • PredictedFavoriteScore (curtidas) • PredictedRetweetScore (reposts) • PredictedReplyScore (respostas) • PredictedGoodClickScore (cliques significativos) • PredictedVideoQualityViewScore (engajamento de vídeo) • PredictedBookmarkScore (salvamentos) • PredictedShareScore (compartilhamentos externos) • PredictedDwellScore (tempo gasto visualizando) • PredictedNegativeFeedbackScore (ocultações/bloqueios) Realidade do Sistema de Pesos ============================== IMPORTANTE: O algoritmo NÃO utiliza pesos percentuais fixos como: ❌ Previsão de Curtidas (35%), Repost (28%), etc. SISTEMA REAL: ✅ Pesos são parâmetros aprendidos do treinamento de ML ✅ Valores padrão no código são 0.0 (substituídos por flags de recursos) ✅ Pesos são personalizados por usuário e constantemente testados A/B ✅ Diferentes tipos de conteúdo (vídeo vs texto) recebem tratamentos diferentes ✅ Pesos mudam com base no contexto em tempo real e no estado do usuário Exemplo de processo de pontuação: 1. Modelos de ML preveem probabilidades de engajamento 2. Flags de recursos fornecem multiplicadores de peso atuais 3. A personalização ajusta pesos para o usuário individual 4. O contexto em tempo real modifica as pontuações finais 5. Regras de negócios aplicam portões de qualidade e diversidade O Que Realmente Impulsiona Conteúdo Viral ========================================== Com base na análise do código, posts virais geralmente: 1. Geram Altas Previsões de Engajamento: - Modelos preveem alta probabilidade de curtidas/reposts/respostas - O conteúdo ressoa com várias comunidades de usuários - Sinais de engajamento inicial fortes 2. Passam Todos os Portões de Qualidade: - Sobrevivem a 24 diferentes estágios de filtragem - Atendem aos padrões de segurança (não spam/NSFW/violento) - O autor tem bons sinais de credibilidade 3. Alcançam Personalização em Escala: - Correspondem a interesses em diversos segmentos de usuários - Disparam similaridade do SimClusters para muitos usuários - Conectam-se através de relacionamentos sociais do RealGraph 4. Otimizam para Mecânicas da Plataforma: - Incluem mídia (imagens/vídeos têm melhor desempenho) - Publicam durante períodos de alta atividade - Usam formatos que incentivam respostas/reposts Principais Conclusões ===================== ✅ A previsão de engajamento é tudo - o algoritmo otimiza para interações dos usuários ✅ A personalização é sofisticada - utiliza embeddings de ML, não simples correspondência de palavras-chave ✅ A filtragem de qualidade é extensa - 24 estágios previnem conteúdo de baixa qualidade ✅ Os pesos são dinâmicos - constantemente otimizados através de ML e testes A/B ✅ A escala importa - o sistema processa bilhões de posts diariamente com latência <50ms ✅ A transparência existe - esta análise é possível porque o X tornou o algoritmo de código aberto O sistema é projetado para destacar conteúdo com o qual os usuários se engajarão, criando um ciclo de feedback que recompensa criadores que entendem seu público e produzem conteúdo envolvente. Resumo: Crie conteúdo que gere engajamento genuíno do seu público-alvo. O algoritmo aprenderá e amplificará o que funciona.
234,81K