شاهدت العديد من تحليلات الخوارزمية ، والتي كانت مفتوحة المصدر للتو. هذا هو أفضل ما رأيته حتى الآن.
Tetsuo.ai
Tetsuo.aiمنذ 21 ساعةً
تحليل خوارزمية توصية X ===================================== استخدم Grok Code Fast للحصول على تحليل سريع لنظام توصيات X. ما الذي يجعل المنشور ينتشر بسرعة =========================== TLDR: التنبؤ بالمشاركة يتفوق على كل شيء. نشر محتوى يولد تفاعلات. استنادا إلى رمز الخوارزمية الفعلي ، عادة ما تحتوي المشاركات التي تحتل المرتبة الأعلى في: + درجات مشاركة عالية متوقعة (تتنبأ نماذج ML بالإعجابات / إعادة النشر / الردود) + تطابق تخصيص قوي (تشابه SimClusters مع اهتمامات المستخدم) + ملاءمة الرسم البياني الاجتماعي (اتصالات RealGraph بشبكة المستخدم) + محتوى الوسائط (الصور / مقاطع الفيديو تحصل على مضاعفات المشاركة) + مصداقية المؤلف (عدد المتابعين ، التحقق ، النتيجة الصافية) + إشارات جودة المحتوى (تمرير البريد العشوائي / NSFW / مرشحات الجودة) + الملاءمة في الوقت المناسب (عامل الحداثة ، الموضوعات الشائعة) + إمكانية المحادثة (درجات عالية في التنبؤ بالرد) تستخدم الخوارزمية نماذج التعلم الآلي للتنبؤ بالمشاركة ، وليس الصيغ البسيطة الموزونة. يتم قياس النجاح من خلال تفاعلات المستخدم الفعلية ، مما يؤدي إلى إنشاء حلقة ملاحظات تعمل باستمرار على تحسين تنبؤات الترتيب. كيف تعمل الخوارزمية بالفعل =============================== 1. جيل المرشحين (9 مصادر): - Earlybird (المشاركات داخل الشبكة) ~ 50٪ - UTEG (توصيات خارج الشبكة) - postMixer ، القوائم ، المجتمعات ، استكشاف المحتوى - مصادر ثابتة ، مخزنة مؤقتا ، ردم 2. ميزة الترطيب (~ 6000 ميزة لكل وظيفة): - ميزات المستخدم (الاهتمامات والسلوك والتركيبة السكانية) - ميزات المنشور (النص ، الوسائط ، البيانات الوصفية ، المشاركة) - ميزات الرسم البياني (SimClusters و RealGraph والاتصالات الاجتماعية) - إشارات الوقت الفعلي (المشاركة الحالية ، حالة الاتجاه) 3. خط أنابيب التهديف (4 نماذج): - تسجيل النموذج (التصنيف الثقيل NAVI) - إعادة تصنيف خط الأنابيب - التسجيل الإرشادي - تسجيل إشارة منخفض 4. التصفية (إجمالي 24 مرشحا): - 10 مرشحات عالمية (العمر < 48 ساعة ، إلغاء البيانات المكررة ، الموقع ، إلخ.) - 14 مرشحا لما بعد النتيجة (سلامة Grok ، واللغة ، ومدة الفيديو ، وما إلى ذلك) 5. الاختيار النهائي والخلط: - الفرز حسب النتائج النهائية - تطبيق قواعد التنوع - امزج مع الإعلانات ، من يتابع ، المطالبات - إنشاء جدول زمني نماذج التنبؤ الرئيسية ==================== تتنبأ الخوارزمية بأنواع المشاركة هذه: • PredictedFavoriteScore (الإعجابات) • PredictedRetweetScore (إعادة النشر) • PredictedReplyScore (الردود) • PredictedGoodClickScore (نقرات ذات مغزى) • PredictedVideoQualityViewScore (مشاركة الفيديو) • PredictedBookmarkScore (يحفظ) • PredictedShareScore (الأسهم الخارجية) • PredictedDwellScore (الوقت المستغرق في المشاهدة) • PredictedNegativeFeedbackScore (يخفي / كتل) واقع نظام الوزن ==================== هام: لا تستخدم الخوارزمية أوزان النسبة المئوية الثابتة مثل: ❌ مثل التنبؤ (35٪) ، إعادة النشر (28٪) ، إلخ. النظام الفعلي: ✅ الأوزان هي معلمات مكتسبة من تدريب ML ✅ القيم الافتراضية في التعليمات البرمجية هي 0.0 (يتم تجاوزها بواسطة علامات الميزات) ✅ يتم تخصيص الأوزان لكل مستخدم ويتم اختبارها باستمرار ✅ أنواع المحتوى المختلفة (الفيديو مقابل النص) تحصل على معاملة مختلفة ✅ تتغير الأوزان بناء على السياق في الوقت الفعلي وحالة المستخدم مثال على عملية تسجيل النقاط: 1. تتنبأ نماذج التعلم الآلي باحتمالات المشاركة 2. توفر أعلام الميزات مضاعفات الوزن الحالية 3. التخصيص يضبط الأوزان للمستخدم الفردي 4. السياق في الوقت الحقيقي يعدل الدرجات النهائية 5. قواعد العمل تطبق بوابات الجودة والتنوع ما الذي يدفع المحتوى الفيروسي بالفعل ================================== استنادا إلى تحليل الكود ، عادة ما تكون المنشورات الفيروسية: 1. إنشاء تنبؤات مشاركة عالية: - تتوقع النماذج احتمالية عالية للإعجاب / إعادة النشر / الرد - المحتوى يتردد صداه لدى مجتمعات المستخدمين المتعددة - إشارات مشاركة مبكرة قوية 2. تمرير جميع بوابات الجودة: - البقاء على قيد الحياة 24 مرحلة تصفية مختلفة - تلبية معايير السلامة (وليس البريد العشوائي / NSFW / العنيف) - المؤلف لديه إشارات مصداقية جيدة 3. تحقيق التخصيص على نطاق واسع: - مطابقة الاهتمامات عبر شرائح المستخدمين المتنوعة - تشغيل تشابه SimClusters للعديد من المستخدمين - التواصل من خلال العلاقات الاجتماعية في RealGraph 4. تحسين ميكانيكا النظام الأساسي: - تضمين الوسائط (أداء الصور / مقاطع الفيديو بشكل أفضل) - النشر خلال فترات النشاط العالي - استخدم التنسيقات التي تشجع الردود / إعادة النشر الوجبات السريعة الرئيسية ============= ✅ التنبؤ بالمشاركة هو كل شيء - تعمل الخوارزمية على تحسين تفاعلات المستخدم ✅ التخصيص متطور - يستخدم عمليات تضمين ML ، وليس مطابقة الكلمات الرئيسية البسيطة ✅ تصفية الجودة واسعة النطاق - 24 مرحلة تمنع المحتوى منخفض الجودة ✅ الأوزان ديناميكية - يتم تحسينها باستمرار من خلال اختبار ML و A / B ✅ المقياس مهم - يعالج النظام مليارات المنشورات يوميا بزمن انتقال <50 مللي ثانية موجودة الشفافية - هذا التحليل ممكن لأن X فتح الخوارزمية المصدر تم تصميم النظام لعرض المحتوى الذي سيتفاعل معه المستخدمون ، مما يخلق حلقة ملاحظات تكافئ المبدعين الذين يفهمون جمهورهم وينتجون محتوى جذابا. خلاصة القول: قم بإنشاء محتوى يولد تفاعلا حقيقيا من جمهورك المستهدف. ستتعلم الخوارزمية وتضخم ما ينجح.
‏‎10.03‏K