Xのレコメンデーションアルゴリズム分析 ===================================== Grok Code Fast を使用して、X のレコメンデーション システムの簡単な内訳を取得しました。 投稿がバイラルになる理由 =========================== TLDR: エンゲージメント予測がすべてに勝ります。インタラクションを生み出すコンテンツを投稿します。 実際のアルゴリズムコードに基づくと、通常、最高ランクの投稿には次のものがあります。 + 高い予測エンゲージメント スコア (ML モデルは「いいね!」/再投稿/返信を予測します) + 強力なパーソナライゼーションマッチ(SimClustersとユーザーの興味との類似性) + ソーシャルグラフの関連性(ユーザーのネットワークへのRealGraph接続) + メディアコンテンツ (画像/ビデオはエンゲージメント乗数を取得します) + 著者の信頼性 (フォロワー数、検証、ツイート スコア) + コンテンツ品質シグナル (スパム/NSFW/品質フィルターを通過) + タイムリーな関連性 (鮮度要素、トレンドトピック) + 会話の可能性 (高い返信予測スコア) このアルゴリズムは、単純な重み付け式ではなく、機械学習モデルを使用してエンゲージメントを予測します。成功は実際のユーザー インタラクションによって測定され、ランキング予測を継続的に改善するフィードバック ループが作成されます。 アルゴリズムが実際にどのように機能するか =============================== 1. 候補者の生成 (9 つのソース): - アーリーバード(ネットワーク内投稿)~50% - UTEG (ネットワーク外の推奨事項) - postMixer、リスト、コミュニティ、コンテンツ探索 - 静的、キャッシュ、バックフィルソース 2. 機能のハイドレーション (投稿あたり ~6000 の特徴): - ユーザーの特徴(興味、行動、人口統計) - 投稿機能(テキスト、メディア、メタデータ、エンゲージメント) - グラフ機能(SimClusters、RealGraph、ソーシャルコネクション) - リアルタイムシグナル(現在のエンゲージメント、トレンドステータス) 3. スコアリングパイプライン (4 モデル): ●モデルスコアリング(NAVIヘビーランカー) - パイプラインのランク付け - ヒューリスティックスコアリング - 低信号スコアリング 4. フィルタリング (合計 24 個のフィルター): - 10 個のグローバル フィルター (48 時間<、重複排除、場所など) - 14 のポストスコア フィルター (Grok の安全性、言語、ビデオの長さなど) 5. 最終選択とミキシング: - 最終スコアで並べ替える - ダイバーシティルールの適用 - 広告、フォローする人、プロンプトとミックス - タイムラインの生成 主要な予測モデル ==================== アルゴリズムは、次のエンゲージメントタイプを予測します。 •PredictedFavoriteScore(いいね) • PredictedRetweetScore(再投稿) • PredictedReplyScore(返信) • PredictedGoodClickScore(意味のあるクリック) • PredictedVideoQualityViewScore(ビデオエンゲージメント) • PredictedBookmarkScore(保存) • PredictedShareScore(外部共有) • PredictedDwellScore(視聴に費やした時間) • PredictedNegativeFeedbackScore(非表示/ブロック) ウェイトシステムの現実 ==================== 重要: アルゴリズムは、次のような固定パーセンテージの重みを使用しません。 ❌ 予測(35%)、リポスト(28%)など。 実際のシステム: ✅ 重みは、ML トレーニングから学習されたパラメーターです ✅ コードの既定値は 0.0 です (機能フラグによってオーバーライドされます) ✅ ウェイトはユーザーごとにパーソナライズされ、常にA/Bテストが行われます ✅ コンテンツの種類(ビデオとテキスト)が異なれば、扱いも異なります ✅ 重みはリアルタイムのコンテキストとユーザーの状態に基づいて変化します スコアリングプロセスの例: 1. ML モデルがエンゲージメントの確率を予測する 2. 機能フラグは現在の重み乗数を提供します 3. パーソナライゼーションにより、個々のユーザーの重みが調整されます 4. リアルタイムのコンテキストにより最終スコアが変更される 5. ビジネスルールは品質ゲートと多様性を適用します 実際にバイラルコンテンツを推進するもの ================================== コード分析に基づいて、バイラル投稿は通常: 1. エンゲージメントの高い予測を生成する: - モデルは高い「いいね!」/再投稿/返信の確率を予測します - コンテンツは複数のユーザーコミュニティの共感を呼ぶ - 強力な早期エンゲージメントシグナル 2. すべての品質ゲートに合格します。 - 24の異なるフィルターステージを生き延びる - 安全基準を満たしている(スパム/NSFW/暴力的ではない) - 著者は良好な信頼性シグナルを持っています 3. 大規模なパーソナライゼーションの実現: - 多様なユーザーセグメントの興味を一致させる - 多くのユーザーに対して SimClusters の類似性をトリガー - RealGraphのソーシャルリレーションシップを通じてつながる 4. プラットフォームの仕組みを最適化します。 - メディアを含める (画像/ビデオのパフォーマンスが向上します) - 活動の多い時期に投稿する - 返信/再投稿を促す形式を使用する 重要なポイント ============= ✅ エンゲージメント予測がすべて - アルゴリズムはユーザーインタラクションに合わせて最適化します ✅ パーソナライゼーションは洗練されています - 単純なキーワードマッチングではなく、ML埋め込みを使用します ✅ 品質フィルタリングは広範囲に及びます - 24段階で低品質のコンテンツを防止 ✅ 重みは動的であり、ML および A/B テストを通じて常に最適化されています ✅ スケールが重要 - システムは毎日数十億の投稿を <50 ミリ秒の遅延で処理します 透明性が存在する - この分析は、X がアルゴリズムをオープンソース化したため可能です このシステムは、ユーザーが関与するコンテンツを表面化するように設計されており、視聴者を理解し、魅力的なコンテンツを制作するクリエイターに報酬を与えるフィードバック ループを作成します。 結論: ターゲット ユーザーから真のエンゲージメントを生み出すコンテンツを作成します。アルゴリズムは、何が機能するかを学習し、増幅します。
234.81K