Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Am văzut mai multe analize ale algo, care a fost doar open source. Acesta este cel mai bun lucru pe care l-am văzut până acum.

9 sept., 12:09
Analiza algoritmului de recomandare a lui X
=====================================
Am folosit Grok Code Fast pentru a obține o defalcare rapidă a sistemului de recomandare al lui X.
Ce face ca o postare să devină virală
===========================
tldr: Predicția implicării depășește totul. Postați conținut care generează interacțiuni.
Pe baza codului algoritmului real, postările care se clasează cel mai bine au, de obicei:
+ Scoruri ridicate de implicare preconizate (modelele ML prezic aprecieri/repostări/răspunsuri)
+ Potrivire puternică de personalizare (asemănarea SimClusters cu interesele utilizatorilor)
+ Relevanța graficului social (conexiuni RealGraph la rețeaua utilizatorului)
+ Conținut media (imaginile/videoclipurile primesc multiplicatori de implicare)
+ Credibilitatea autorului (număr de urmăritori, verificare, scor tweepcred)
+ Semnale de calitate a conținutului (trece de spam/NSFW/filtre de calitate)
+ Relevanță în timp util (factor de prospețime, subiecte în tendințe)
+ Potențial de conversație (scoruri ridicate de predicție a răspunsului)
Algoritmul folosește modele de învățare automată pentru a prezice implicarea, nu formule simple ponderate. Succesul este măsurat prin interacțiunile reale ale utilizatorilor, creând o buclă de feedback care îmbunătățește continuu predicțiile de clasare.
Cum funcționează de fapt algoritmul
===============================
1. Generația candidată (9 surse):
- Earlybird (postări în rețea) ~50%
- UTEG (recomandări în afara rețelei)
- postMixer, Liste, Comunități, Explorare conținut
- Surse statice, cache, de umplere
2. Hidratare caracteristică (~ 6000 caracteristici pe postare):
- Caracteristicile utilizatorului (interese, comportament, date demografice)
- funcții de postare (text, media, metadate, implicare)
- Caracteristici grafice (SimClusters, RealGraph, conexiuni sociale)
- Semnale în timp real (implicare curentă, stare de tendințe)
3. Conductă de notare (4 modele):
- Model Scoring (rang greu NAVI)
- Conducta de reclasificare
- Scor euristic
- Scor scăzut al semnalului
4. Filtrare (24 de filtre în total):
- 10 Filtre globale (vârsta < 48 de ore, deduplicare, locație etc.)
- 14 filtre post-scor (siguranța Glok, limba, durata video etc.)
5. Selecția finală și mixarea:
- Sortați după scorurile finale
- Aplicarea regulilor de diversitate
- Amestecați cu reclame, pe cine să urmărească, solicitări
- Generați cronologie
Modele cheie de predicție
====================
Algoritmul prezice aceste tipuri de implicare:
• PredictedFavoriteScore (aprecieri)
• PredictedRetweetScore (repostări)
• PredictedReplyScore (răspunsuri)
• PredictedGoodClickScore (clicuri semnificative)
• PredictedVideoQualityViewScore (implicare video)
• PredictedBookmarkScore (salvări)
• PredictedShareScore (acțiuni externe)
• PredictedDwellScore (timp petrecut vizualizând)
• PredictedNegativeFeedbackScore (ascunde/blochează)
Realitatea sistemului de greutate
====================
IMPORTANT: Algoritmul NU folosește ponderi procentuale fixe, cum ar fi:
❌ Ca predicția (35%), repostarea (28%) etc.
SISTEM REAL:
✅ Greutățile sunt parametri învățați din antrenamentul ML
✅ Valorile implicite din cod sunt 0.0 (suprascrise de steagurile de caracteristici)
✅ Greutățile sunt personalizate pentru fiecare utilizator și testate constant A/B
✅ Diferite tipuri de conținut (video vs text) primesc un tratament diferit
✅ Ponderile se modifică în funcție de contextul în timp real și de starea utilizatorului
Exemplu de proces de notare:
1. Modelele ML prezic probabilitățile de implicare
2. Steagurile de caracteristici oferă multiplicatori de greutate curente
3. Personalizarea ajustează greutățile pentru utilizatorul individual
4. Contextul în timp real modifică scorurile finale
5. Regulile de afaceri aplică porți de calitate și diversitate
Ce conduce de fapt conținutul viral
==================================
Pe baza analizei codului, postările virale de obicei:
1. Generați predicții de implicare ridicată:
- Modelele prezic o probabilitate mare de like/repostare/răspuns
- Conținutul rezonează cu mai multe comunități de utilizatori
- Semnale puternice de implicare timpurie
2. Treceți toate porțile de calitate:
- Supraviețuiește 24 de etape diferite de filtrare
- Îndeplinește standardele de siguranță (nu spam/NSFW/violent)
- Autorul are semnale bune de credibilitate
3. Realizați personalizarea la scară largă:
- Potriviți interesele din diverse segmente de utilizatori
- Declanșează similitudinea SimCluster-urilor pentru mulți utilizatori
- Conectați-vă prin relațiile sociale RealGraph
4. Optimizați pentru mecanica platformei:
- Includeți media (imaginile/videoclipurile au performanțe mai bune)
- Postați în perioadele de activitate ridicată
- Folosiți formate care încurajează răspunsurile/repostările
Principalele concluzii
=============
✅ Predicția implicării este totul - algoritmul optimizează interacțiunile cu utilizatorii
✅ Personalizarea este sofisticată - folosește încorporari ML, nu o simplă potrivire a cuvintelor cheie
✅ Filtrarea calității este extinsă - 24 de etape împiedică conținutul de calitate scăzută
✅ Greutățile sunt dinamice - optimizate constant prin ML și teste A/B
✅ Scara contează - sistemul procesează miliarde de postări zilnic cu latenc de <50ms Transparența există - această analiză este posibilă deoarece X a deschis algoritmul
Sistemul este conceput pentru a scoate la iveală conținutul cu care utilizatorii vor interacționa, creând o buclă de feedback care recompensează creatorii care își înțeleg publicul și produc conținut captivant.
Concluzie: Creați conținut care generează o implicare reală din partea publicului țintă. Algoritmul va învăța și va amplifica ceea ce funcționează.
10,61K
Limită superioară
Clasament
Favorite