热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
看过几篇关于这个刚刚开源的算法的分析,这是我迄今为止看到的最好的一篇。

9月9日 12:09
X的推荐算法分析
=====================================
使用Grok Code Fast快速分析X的推荐系统。
什么让帖子变得病毒式传播
===========================
tldr: 互动预测胜过一切。发布能够产生互动的内容。
根据实际的算法代码,排名最高的帖子通常具有:
+ 高预测互动分数(机器学习模型预测点赞/转发/回复)
+ 强个性化匹配(SimClusters与用户兴趣的相似度)
+ 社交图谱相关性(RealGraph与用户网络的连接)
+ 媒体内容(图片/视频获得互动倍增器)
+ 作者可信度(粉丝数量、验证、tweepcred分数)
+ 内容质量信号(通过垃圾邮件/不适宜内容/质量过滤)
+ 及时相关性(新鲜度因素、热门话题)
+ 对话潜力(高回复预测分数)
该算法使用机器学习模型来预测互动,而不是简单的加权公式。成功通过实际用户互动来衡量,形成一个不断改善排名预测的反馈循环。
算法的实际工作原理
===============================
1. 候选生成(9个来源):
- Earlybird(网络内帖子)~50%
- UTEG(网络外推荐)
- postMixer、列表、社区、内容探索
- 静态、缓存、回填来源
2. 特征注入(每个帖子约6000个特征):
- 用户特征(兴趣、行为、人口统计)
- 帖子特征(文本、媒体、元数据、互动)
- 图谱特征(SimClusters、RealGraph、社交连接)
- 实时信号(当前互动、趋势状态)
3. 评分管道(4个模型):
- 模型评分(NAVI重排名器)
- 重新排名管道
- 启发式评分
- 低信号评分
4. 过滤(共24个过滤器):
- 10个全局过滤器(年龄<48小时、去重、位置等)
- 14个帖子评分过滤器(Grok安全性、语言、视频时长等)
5. 最终选择与混合:
- 按最终分数排序
- 应用多样性规则
- 与广告、关注建议、提示混合
- 生成时间线
关键预测模型
====================
该算法预测这些互动类型:
• 预测点赞分数(likes)
• 预测转发分数(reposts)
• 预测回复分数(replies)
• 预测有意义点击分数(meaningful clicks)
• 预测视频质量观看分数(video engagement)
• 预测收藏分数(saves)
• 预测分享分数(external shares)
• 预测停留时间分数(time spent viewing)
• 预测负反馈分数(hides/blocks)
权重系统现实
====================
重要提示:该算法不使用固定百分比权重,如:
❌ 点赞预测(35%)、转发(28%)等。
实际系统:
✅ 权重是从机器学习训练中学习的参数
✅ 代码中的默认值为0.0(由特征标志覆盖)
✅ 权重根据用户个性化并不断进行A/B测试
✅ 不同内容类型(视频与文本)获得不同处理
✅ 权重根据实时上下文和用户状态变化
示例评分过程:
1. 机器学习模型预测互动概率
2. 特征标志提供当前权重倍增器
3. 个性化调整个别用户的权重
4. 实时上下文修改最终分数
5. 商业规则应用质量门和多样性
什么真正驱动病毒内容
==================================
根据代码分析,病毒帖子通常:
1. 生成高互动预测:
- 模型预测高点赞/转发/回复概率
- 内容与多个用户社区产生共鸣
- 强烈的早期互动信号
2. 通过所有质量门:
- 经历24个不同的过滤阶段
- 满足安全标准(不是垃圾邮件/不适宜内容/暴力)
- 作者具有良好的可信度信号
3. 实现大规模个性化:
- 在不同用户群体中匹配兴趣
- 触发SimClusters相似性以适应许多用户
- 通过RealGraph社交关系连接
4. 针对平台机制进行优化:
- 包含媒体(图片/视频表现更好)
- 在高活动期间发布
- 使用鼓励回复/转发的格式
关键要点
=============
✅ 互动预测是关键 - 算法优化用户互动
✅ 个性化是复杂的 - 使用机器学习嵌入,而不是简单的关键词匹配
✅ 质量过滤是广泛的 - 24个阶段防止低质量内容
✅ 权重是动态的 - 通过机器学习和A/B测试不断优化
✅ 规模很重要 - 系统每天处理数十亿个帖子,延迟<50毫秒
✅ 透明度存在 - 该分析之所以可能,是因为X开源了算法
该系统旨在展示用户将参与的内容,形成一个反馈循环,奖励那些理解其受众并制作引人入胜内容的创作者。
底线:创建能够从目标受众中产生真实互动的内容。算法将学习并放大有效的内容。
10.04K
热门
排行
收藏