Analisis Algoritma Rekomendasi X ===================================== Menggunakan Grok Code Fast untuk mendapatkan perincian cepat dari sistem rekomendasi X. Apa yang Membuat Postingan Menjadi Viral =========================== tldr: Prediksi keterlibatan mengalahkan segalanya. Posting konten yang menghasilkan interaksi. Berdasarkan kode algoritme aktual, postingan dengan peringkat tertinggi biasanya memiliki: + Skor keterlibatan prediksi tinggi (model ML memprediksi suka/repost/balasan) + Kecocokan personalisasi yang kuat (kemiripan SimCluster dengan minat pengguna) + Relevansi grafik sosial (koneksi RealGraph ke jaringan pengguna) + Konten media (gambar/video mendapatkan pengganda keterlibatan) + Kredibilitas penulis (jumlah pengikut, verifikasi, skor tweepcred) + Sinyal kualitas konten (melewati filter spam/NSFW/kualitas) + Relevansi tepat waktu (faktor kesegaran, topik yang sedang tren) + Potensi percakapan (skor prediksi balasan tinggi) Algoritme menggunakan model pembelajaran mesin untuk memprediksi keterlibatan, bukan rumus berbobot sederhana. Keberhasilan diukur dengan interaksi pengguna yang sebenarnya, menciptakan loop umpan balik yang terus meningkatkan prediksi peringkat. Bagaimana Algoritma Sebenarnya Bekerja =============================== 1. Generasi Kandidat (9 sumber): - Earlybird (postingan dalam jaringan) ~50% - UTEG (rekomendasi di luar jaringan) - postMixer, Daftar, Komunitas, Eksplorasi Konten - Sumber statis, Cache, Isi ulang 2. Hidrasi Fitur (~6000 fitur per posting): - Fitur pengguna (minat, perilaku, demografi) - fitur posting (teks, media, metadata, keterlibatan) - Fitur grafik (SimClusters, RealGraph, koneksi sosial) - Sinyal waktu nyata (keterlibatan saat ini, status tren) 3. Pipa Penilaian (4 model): - Penilaian Model (peringkat berat NAVI) - Peringkat ulang Pipa - Penilaian Heuristik - Skor Sinyal Rendah 4. Penyaringan (24 filter total): - 10 Filter Global (usia < 48 jam, deduplikasi, lokasi, dll.) - 14 Filter Pasca-Skor (keamanan Grok, bahasa, durasi video, dll.) 5. Seleksi Akhir & Pencampuran: - Urutkan berdasarkan skor akhir - Terapkan aturan keragaman - Campur dengan iklan, siapa yang harus diikuti, petunjuk - Hasilkan linimasa Model Prediksi Utama ==================== Algoritme memprediksi jenis keterlibatan ini: • PredictedFavoriteScore (suka) • PredictedRetweetScore (repost) • PredictedReplyScore (balasan) • PredictedGoodClickScore (klik yang bermakna) • PredictedVideoQualityViewScore (keterlibatan video) • PredictedBookmarkScore (penyimpanan) • PredictedShareScore (berbagi eksternal) • PredictedDwellScore (waktu yang dihabiskan untuk menonton) • PredictedNegativeFeedbackScore (menyembunyikan/memblokir) Realitas Sistem Berat ==================== PENTING: Algoritme TIDAK menggunakan bobot persentase tetap seperti: ❌ Seperti Prediksi (35%), Repost (28%), dll. SISTEM AKTUAL: ✅ Bobot adalah parameter yang dipelajari dari pelatihan ML ✅ Nilai default dalam kode adalah 0,0 (ditimpa oleh bendera fitur) ✅ Bobot dipersonalisasi per pengguna dan terus diuji A/B ✅ Jenis konten yang berbeda (video vs teks) mendapatkan perlakuan yang berbeda ✅ Bobot berubah berdasarkan konteks real-time dan status pengguna Contoh proses penilaian: 1. Model ML memprediksi probabilitas keterlibatan 2. Bendera fitur memberikan pengganda berat saat ini 3. Personalisasi menyesuaikan bobot untuk pengguna individu 4. Konteks real-time memodifikasi skor akhir 5. Aturan bisnis menerapkan gerbang kualitas dan keragaman Apa yang Sebenarnya Mendorong Konten Viral ================================== Berdasarkan analisis kode, postingan viral biasanya: 1. Hasilkan Prediksi Keterlibatan Tinggi: - Model memprediksi probabilitas suka/repost/balas yang tinggi - Konten beresonansi dengan beberapa komunitas pengguna - Sinyal keterlibatan awal yang kuat 2. Lewati Semua Gerbang Berkualitas: - Bertahan dari 24 tahap filter yang berbeda - Memenuhi standar keamanan (bukan spam/NSFW/kekerasan) - Penulis memiliki sinyal kredibilitas yang baik 3. Mencapai Personalisasi dalam Skala Besar: - Cocokkan minat di berbagai segmen pengguna - Memicu kesamaan SimClusters untuk banyak pengguna - Terhubung melalui hubungan sosial RealGraph 4. Optimalkan untuk Mekanika Platform: - Sertakan media (gambar/video berkinerja lebih baik) - Posting selama periode aktivitas tinggi - Gunakan format yang mendorong balasan/repost Takeaways Utama ============= ✅ Prediksi keterlibatan adalah segalanya - algoritme mengoptimalkan interaksi pengguna ✅ Personalisasi itu canggih - menggunakan penyematan ML, bukan pencocokan kata kunci sederhana ✅ Penyaringan kualitas ekstensif - 24 tahap mencegah konten berkualitas rendah ✅ Bobot bersifat dinamis - terus dioptimalkan melalui pengujian ML dan A/B ✅ Skala penting - sistem memproses miliaran posting setiap hari dengan <50ms latenc Transparansi ada - analisis ini dimungkinkan karena X membuka algoritme Sistem ini dirancang untuk menampilkan konten yang akan terlibat pengguna, menciptakan lingkaran umpan balik yang memberi penghargaan kepada pembuat konten yang memahami audiens mereka dan menghasilkan konten yang menarik. Intinya: Buat konten yang menghasilkan keterlibatan asli dari audiens target Anda. Algoritma akan mempelajari dan memperkuat apa yang berhasil.
130,43K