熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
X的推薦算法分析
=====================================
使用Grok Code Fast快速分析X的推薦系統。
什麼讓帖子變得病毒式傳播
===========================
tldr: 互動預測勝過一切。發布能夠產生互動的內容。
根據實際的算法代碼,排名最高的帖子通常具有:
+ 高預測互動分數(機器學習模型預測點讚/轉發/回覆)
+ 強個性化匹配(SimClusters與用戶興趣的相似度)
+ 社交圖譜相關性(RealGraph與用戶網絡的連接)
+ 媒體內容(圖片/視頻獲得互動倍增器)
+ 作者可信度(粉絲數量、驗證、tweepcred分數)
+ 內容質量信號(通過垃圾郵件/不適宜內容/質量過濾)
+ 及時相關性(新鮮度因素、熱門話題)
+ 對話潛力(高回覆預測分數)
該算法使用機器學習模型來預測互動,而不是簡單的加權公式。成功通過實際用戶互動來衡量,形成一個不斷改善排名預測的反饋循環。
算法的實際工作原理
===============================
1. 候選生成(9個來源):
- Earlybird(網絡內帖子)~50%
- UTEG(網絡外推薦)
- postMixer、列表、社區、內容探索
- 靜態、緩存、回填來源
2. 特徵注入(每個帖子約6000個特徵):
- 用戶特徵(興趣、行為、人口統計)
- 帖子特徵(文本、媒體、元數據、互動)
- 圖譜特徵(SimClusters、RealGraph、社交連接)
- 實時信號(當前互動、趨勢狀態)
3. 评分管道(4個模型):
- 模型评分(NAVI重排名器)
- 重新排名管道
- 啟發式评分
- 低信號评分
4. 过滤(共24個过滤器):
- 10個全局过滤器(年齡<48小時、去重、位置等)
- 14個帖子评分过滤器(Grok安全性、語言、視頻時長等)
5. 最終選擇與混合:
- 按最終分數排序
- 應用多樣性規則
- 與廣告、關注建議、提示混合
- 生成時間線
關鍵預測模型
====================
該算法預測這些互動類型:
• 預測點讚分數(likes)
• 預測轉發分數(reposts)
• 預測回覆分數(replies)
• 預測有意義點擊分數(meaningful clicks)
• 預測視頻質量觀看分數(video engagement)
• 預測收藏分數(saves)
• 預測分享分數(external shares)
• 預測停留時間分數(time spent viewing)
• 預測負反饋分數(hides/blocks)
權重系統現實
====================
重要提示:該算法不使用固定百分比權重,如:
❌ 點讚預測(35%)、轉發(28%)等。
實際系統:
✅ 權重是從機器學習訓練中學習的參數
✅ 代碼中的默認值為0.0(由特徵標誌覆蓋)
✅ 權重根據用戶個性化並不斷進行A/B測試
✅ 不同內容類型(視頻與文本)獲得不同處理
✅ 權重根據實時上下文和用戶狀態變化
示例評分過程:
1. 機器學習模型預測互動概率
2. 特徵標誌提供當前權重倍增器
3. 個性化調整個別用戶的權重
4. 實時上下文修改最終分數
5. 商業規則應用質量門和多樣性
什麼真正驅動病毒內容
==================================
根據代碼分析,病毒帖子通常:
1. 生成高互動預測:
- 模型預測高點讚/轉發/回覆概率
- 內容與多個用戶社區產生共鳴
- 強烈的早期互動信號
2. 通過所有質量門:
- 經歷24個不同的過濾階段
- 滿足安全標準(不是垃圾郵件/不適宜內容/暴力)
- 作者具有良好的可信度信號
3. 實現大規模個性化:
- 在不同用戶群體中匹配興趣
- 觸發SimClusters相似性以適應許多用戶
- 通過RealGraph社交關係連接
4. 針對平台機制進行優化:
- 包含媒體(圖片/視頻表現更好)
- 在高活動期間發布
- 使用鼓勵回覆/轉發的格式
關鍵要點
=============
✅ 互動預測是關鍵 - 算法優化用戶互動
✅ 個性化是複雜的 - 使用機器學習嵌入,而不是簡單的關鍵詞匹配
✅ 質量過濾是廣泛的 - 24個階段防止低質量內容
✅ 權重是動態的 - 通過機器學習和A/B測試不斷優化
✅ 規模很重要 - 系統每天處理數十億個帖子,延遲<50毫秒
✅ 透明度存在 - 該分析之所以可能,是因為X開源了算法
該系統旨在展示用戶將參與的內容,形成一個反饋循環,獎勵那些理解其受眾並製作引人入勝內容的創作者。
底線:創建能夠從目標受眾中產生真實互動的內容。算法將學習並放大有效的內容。
234.81K
熱門
排行
收藏