トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
オープンソース化されたばかりのアルゴの分析をいくつか見ました。これは私が今まで見た中で最高です。

9月9日 12:09
Xのレコメンデーションアルゴリズム分析
=====================================
Grok Code Fast を使用して、X のレコメンデーション システムの簡単な内訳を取得しました。
投稿がバイラルになる理由
===========================
TLDR: エンゲージメント予測がすべてに勝ります。インタラクションを生み出すコンテンツを投稿します。
実際のアルゴリズムコードに基づくと、通常、最高ランクの投稿には次のものがあります。
+ 高い予測エンゲージメント スコア (ML モデルは「いいね!」/再投稿/返信を予測します)
+ 強力なパーソナライゼーションマッチ(SimClustersとユーザーの興味との類似性)
+ ソーシャルグラフの関連性(ユーザーのネットワークへのRealGraph接続)
+ メディアコンテンツ (画像/ビデオはエンゲージメント乗数を取得します)
+ 著者の信頼性 (フォロワー数、検証、ツイート スコア)
+ コンテンツ品質シグナル (スパム/NSFW/品質フィルターを通過)
+ タイムリーな関連性 (鮮度要素、トレンドトピック)
+ 会話の可能性 (高い返信予測スコア)
このアルゴリズムは、単純な重み付け式ではなく、機械学習モデルを使用してエンゲージメントを予測します。成功は実際のユーザー インタラクションによって測定され、ランキング予測を継続的に改善するフィードバック ループが作成されます。
アルゴリズムが実際にどのように機能するか
===============================
1. 候補者の生成 (9 つのソース):
- アーリーバード(ネットワーク内投稿)~50%
- UTEG (ネットワーク外の推奨事項)
- postMixer、リスト、コミュニティ、コンテンツ探索
- 静的、キャッシュ、バックフィルソース
2. 機能のハイドレーション (投稿あたり ~6000 の特徴):
- ユーザーの特徴(興味、行動、人口統計)
- 投稿機能(テキスト、メディア、メタデータ、エンゲージメント)
- グラフ機能(SimClusters、RealGraph、ソーシャルコネクション)
- リアルタイムシグナル(現在のエンゲージメント、トレンドステータス)
3. スコアリングパイプライン (4 モデル):
●モデルスコアリング(NAVIヘビーランカー)
- パイプラインのランク付け
- ヒューリスティックスコアリング
- 低信号スコアリング
4. フィルタリング (合計 24 個のフィルター):
- 10 個のグローバル フィルター (48 時間<、重複排除、場所など)
- 14 のポストスコア フィルター (Grok の安全性、言語、ビデオの長さなど)
5. 最終選択とミキシング:
- 最終スコアで並べ替える
- ダイバーシティルールの適用
- 広告、フォローする人、プロンプトとミックス
- タイムラインの生成
主要な予測モデル
====================
アルゴリズムは、次のエンゲージメントタイプを予測します。
•PredictedFavoriteScore(いいね)
• PredictedRetweetScore(再投稿)
• PredictedReplyScore(返信)
• PredictedGoodClickScore(意味のあるクリック)
• PredictedVideoQualityViewScore(ビデオエンゲージメント)
• PredictedBookmarkScore(保存)
• PredictedShareScore(外部共有)
• PredictedDwellScore(視聴に費やした時間)
• PredictedNegativeFeedbackScore(非表示/ブロック)
ウェイトシステムの現実
====================
重要: アルゴリズムは、次のような固定パーセンテージの重みを使用しません。
❌ 予測(35%)、リポスト(28%)など。
実際のシステム:
✅ 重みは、ML トレーニングから学習されたパラメーターです
✅ コードの既定値は 0.0 です (機能フラグによってオーバーライドされます)
✅ ウェイトはユーザーごとにパーソナライズされ、常にA/Bテストが行われます
✅ コンテンツの種類(ビデオとテキスト)が異なれば、扱いも異なります
✅ 重みはリアルタイムのコンテキストとユーザーの状態に基づいて変化します
スコアリングプロセスの例:
1. ML モデルがエンゲージメントの確率を予測する
2. 機能フラグは現在の重み乗数を提供します
3. パーソナライゼーションにより、個々のユーザーの重みが調整されます
4. リアルタイムのコンテキストにより最終スコアが変更される
5. ビジネスルールは品質ゲートと多様性を適用します
実際にバイラルコンテンツを推進するもの
==================================
コード分析に基づいて、バイラル投稿は通常:
1. エンゲージメントの高い予測を生成する:
- モデルは高い「いいね!」/再投稿/返信の確率を予測します
- コンテンツは複数のユーザーコミュニティの共感を呼ぶ
- 強力な早期エンゲージメントシグナル
2. すべての品質ゲートに合格します。
- 24の異なるフィルターステージを生き延びる
- 安全基準を満たしている(スパム/NSFW/暴力的ではない)
- 著者は良好な信頼性シグナルを持っています
3. 大規模なパーソナライゼーションの実現:
- 多様なユーザーセグメントの興味を一致させる
- 多くのユーザーに対して SimClusters の類似性をトリガー
- RealGraphのソーシャルリレーションシップを通じてつながる
4. プラットフォームの仕組みを最適化します。
- メディアを含める (画像/ビデオのパフォーマンスが向上します)
- 活動の多い時期に投稿する
- 返信/再投稿を促す形式を使用する
重要なポイント
=============
✅ エンゲージメント予測がすべて - アルゴリズムはユーザーインタラクションに合わせて最適化します
✅ パーソナライゼーションは洗練されています - 単純なキーワードマッチングではなく、ML埋め込みを使用します
✅ 品質フィルタリングは広範囲に及びます - 24段階で低品質のコンテンツを防止
✅ 重みは動的であり、ML および A/B テストを通じて常に最適化されています
✅ スケールが重要 - システムは毎日数十億の投稿を <50 ミリ秒の遅延で処理します 透明性が存在する - この分析は、X がアルゴリズムをオープンソース化したため可能です
このシステムは、ユーザーが関与するコンテンツを表面化するように設計されており、視聴者を理解し、魅力的なコンテンツを制作するクリエイターに報酬を与えるフィードバック ループを作成します。
結論: ターゲット ユーザーから真のエンゲージメントを生み出すコンテンツを作成します。アルゴリズムは、何が機能するかを学習し、増幅します。
10.04K
トップ
ランキング
お気に入り