Sett flera analyser av algo, som bara var öppen källkod. Det här är det bästa jag har sett hittills.
Tetsuo.ai
Tetsuo.ai9 sep. 12:09
X:s analys av rekommendationsalgoritmen ===================================== Använde Grok Code Fast för att få en snabb uppdelning av X's rekommendationssystem. Vad får ett inlägg att bli viralt? =========================== tldr: Engagemangsförutsägelse trumfar allt. Publicera innehåll som genererar interaktioner. Baserat på den faktiska algoritmkoden har inlägg som rankas högst vanligtvis: + Höga förutspådda engagemangspoäng (ML-modeller förutsäger gilla-markeringar/reposts/svar) + Stark matchning av personalisering (SimClusters likhet med användarnas intressen) + Relevans för sociala diagram (RealGraph-anslutningar till användarens nätverk) + Medieinnehåll (bilder/videor får engagemangsmultiplikatorer) + Författarens trovärdighet (antal följare, verifiering, tweepcred-poäng) + Signaler för innehållskvalitet (passerar spam/NSFW/kvalitetsfilter) + Relevans i rätt tid (färskhetsfaktor, trendiga ämnen) + Konversationspotential (höga poäng för förutsägelse av svar) Algoritmen använder maskininlärningsmodeller för att förutsäga engagemang, inte enkla viktade formler. Framgång mäts genom faktiska användarinteraktioner, vilket skapar en återkopplingsslinga som kontinuerligt förbättrar rankningsförutsägelserna. Hur algoritmen faktiskt fungerar =============================== 1. Kandidatgenerering (9 källor): - Earlybird (inlägg i nätverket) ~50 % - UTEG (rekommendationer utanför nätverket) - postMixer, Listor, Gemenskaper, Innehållsutforskning - Statiska, cachelagrade, återfyllnadskällor 2. Funktion Hydrering (~ 6000 funktioner per inlägg): - Användarfunktioner (intressen, beteende, demografi) - Inläggsfunktioner (text, media, metadata, engagemang) - Graffunktioner (SimClusters, RealGraph, sociala kontakter) - Signaler i realtid (aktuellt engagemang, trendstatus) 3. Poängsättning av pipeline (4 modeller): - Modellbedömning (NAVI tung rankare) - Omrankning av pipeline - Heuristisk poängsättning - Låg signalpoäng 4. Filtrering (totalt 24 filter): - 10 globala filter (ålder < 48 timmar, deduplicering, plats, etc.) - 14 Post-Score-filter (Grok-säkerhet, språk, videolängd, etc.) 5. Slutlig Urval & Mixning: - Sortera efter slutresultat - Tillämpa mångfaldsregler - Blanda med annonser, vem man ska följa, uppmaningar - Generera tidslinje Modeller för nyckelprediktion ==================== Algoritmen förutsäger dessa engagemangstyper: • PredictedFavoriteScore (gillar) • PredictedRetweetScore (reposters) • PredictedReplyScore (svar) • PredictedGoodClickScore (meningsfulla klick) • PredictedVideoQualityViewScore (videoengagemang) • PredictedBookmarkScore (räddningar) • PredictedShareScore (externa delningar) • PredictedDwellScore (tid som spenderas på att titta) • PredictedNegativeFeedbackScore (döljer/blockerar) Viktsystem Verklighet ==================== VIKTIGT: Algoritmen använder INTE fasta procentvikter som: ❌ Gilla Prediction (35%), Repost (28%), etc. FAKTISKA SYSTEMET: ✅ Vikter är inlärda parametrar från ML-träning ✅ Standardvärden i koden är 0,0 (åsidosätts av funktionsflaggor) ✅ Vikterna anpassas per användare och testas ständigt A/B-testad ✅ Olika innehållstyper (video kontra text) behandlas olika ✅ Vikterna ändras baserat på realtidskontext och användartillstånd Exempel på poängsättningsprocess: 1. ML-modeller förutsäger sannolikheter för engagemang 2. Funktionsflaggor ger aktuella viktmultiplikatorer 3. Personalisering justerar vikter för enskilda användare 4. Kontext i realtid ändrar slutpoängen 5. Affärsregler gäller kvalitet, grindar och mångfald Vad som faktiskt driver viralt innehåll ================================== Baserat på kodanalys gör virala inlägg vanligtvis: 1. Generera förutsägelser med högt engagemang: - Modeller förutsäger hög sannolikhet för like/repost/reply - Innehållet resonerar med flera användargrupper - Starka signaler om tidigt engagemang 2. Passera alla kvalitetsgrindar: - Överlev 24 olika filtersteg - Uppfylla säkerhetsstandarder (inte spam/NSFW/våldsam) - Författaren har goda trovärdighetssignaler 3. Uppnå personalisering i stor skala: - Matcha intressen över olika användarsegment - Trigga SimClusters-likhet för många användare - Koppla upp dig genom RealGraphs sociala relationer 4. Optimera för plattformsmekanik: - Inkludera media (bilder/videor presterar bättre) - Inlägg under perioder med hög aktivitet - Använd format som uppmuntrar till svar/reposts Viktigt att ta med sig ============= ✅ Engagemangsförutsägelse är allt - algoritmen optimerar för användarinteraktioner ✅ Personalisering är sofistikerad - använder ML-inbäddningar, inte enkel nyckelordsmatchning ✅ Kvalitetsfiltreringen är omfattande - 24 steg förhindrar innehåll av låg kvalitet ✅ Vikterna är dynamiska – ständigt optimerade genom ML- och A/B-tester ✅ Skala spelar roll - systemet bearbetar miljarder inlägg dagligen med <50ms latenc Transparens finns - denna analys är möjlig eftersom X öppen källkod algoritmen Systemet är utformat för att visa innehåll som användare kommer att engagera sig i, vilket skapar en feedbackloop som belönar kreatörer som förstår sin publik och producerar engagerande innehåll. Slutsats: Skapa innehåll som genererar genuint engagemang från din målgrupp. Algoritmen kommer att lära sig och förstärka det som fungerar.
10,62K