Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Phân Tích Thuật Toán Đề Xuất Của X
=====================================
Sử dụng Grok Code Fast để có cái nhìn nhanh về hệ thống đề xuất của X.
Điều Gì Khiến Một Bài Đăng Trở Nên Viral
===========================
tldr: Dự đoán mức độ tương tác quan trọng hơn mọi thứ. Đăng nội dung tạo ra sự tương tác.
Dựa trên mã thuật toán thực tế, các bài đăng có thứ hạng cao nhất thường có:
+ Điểm dự đoán mức độ tương tác cao (các mô hình ML dự đoán lượt thích/đăng lại/phản hồi)
+ Sự phù hợp cá nhân hóa mạnh mẽ (SimClusters tương đồng với sở thích của người dùng)
+ Độ liên quan của mạng xã hội (RealGraph kết nối với mạng lưới của người dùng)
+ Nội dung truyền thông (hình ảnh/video nhận được hệ số tương tác)
+ Độ tin cậy của tác giả (số lượng người theo dõi, xác minh, điểm tweepcred)
+ Tín hiệu chất lượng nội dung (vượt qua bộ lọc spam/NSFW/chất lượng)
+ Độ liên quan kịp thời (yếu tố mới mẻ, chủ đề đang thịnh hành)
+ Tiềm năng trò chuyện (điểm dự đoán phản hồi cao)
Thuật toán sử dụng các mô hình học máy để dự đoán mức độ tương tác, không phải các công thức trọng số đơn giản. Thành công được đo bằng các tương tác thực tế của người dùng, tạo ra một vòng phản hồi liên tục cải thiện dự đoán xếp hạng.
Cách Thuật Toán Thực Sự Hoạt Động
===============================
1. Tạo ứng viên (9 nguồn):
- Earlybird (các bài đăng trong mạng) ~50%
- UTEG (đề xuất ngoài mạng)
- postMixer, Danh sách, Cộng đồng, Khám phá Nội dung
- Nguồn tĩnh, Cached, Backfill
2. Cung cấp tính năng (~6000 tính năng cho mỗi bài đăng):
- Tính năng người dùng (sở thích, hành vi, nhân khẩu học)
- Tính năng bài đăng (văn bản, phương tiện, siêu dữ liệu, mức độ tương tác)
- Tính năng đồ thị (SimClusters, RealGraph, kết nối xã hội)
- Tín hiệu thời gian thực (mức độ tương tác hiện tại, trạng thái thịnh hành)
3. Quy trình chấm điểm (4 mô hình):
- Chấm điểm mô hình (NAVI heavy ranker)
- Quy trình xếp hạng lại
- Chấm điểm theo quy tắc
- Chấm điểm tín hiệu thấp
4. Lọc (24 bộ lọc tổng cộng):
- 10 Bộ lọc Toàn cầu (tuổi < 48h, loại bỏ trùng lặp, vị trí, v.v.)
- 14 Bộ lọc Điểm Bài Đăng (an toàn Grok, ngôn ngữ, thời gian video, v.v.)
5. Lựa chọn cuối cùng & Trộn:
- Sắp xếp theo điểm cuối cùng
- Áp dụng quy tắc đa dạng
- Trộn với quảng cáo, ai nên theo dõi, gợi ý
- Tạo dòng thời gian
Các Mô Hình Dự Đoán Chính
====================
Thuật toán dự đoán các loại tương tác này:
• Điểm Dự Đoán Yêu Thích (likes)
• Điểm Dự Đoán Đăng Lại (reposts)
• Điểm Dự Đoán Phản Hồi (replies)
• Điểm Dự Đoán Nhấp Chuột Tốt (nhấp chuột có ý nghĩa)
• Điểm Dự Đoán Chất Lượng Video (tương tác video)
• Điểm Dự Đoán Đánh Dấu (saves)
• Điểm Dự Đoán Chia Sẻ (chia sẻ bên ngoài)
• Điểm Dự Đoán Thời Gian Duyệt (thời gian xem)
• Điểm Dự Đoán Phản Hồi Tiêu Cực (ẩn/chặn)
Thực Tế Hệ Thống Trọng Số
=====================
QUAN TRỌNG: Thuật toán KHÔNG sử dụng trọng số phần trăm cố định như:
❌ Dự Đoán Thích (35%), Đăng Lại (28%), v.v.
HỆ THỐNG THỰC TẾ:
✅ Trọng số là các tham số học được từ đào tạo ML
✅ Giá trị mặc định trong mã là 0.0 (bị ghi đè bởi cờ tính năng)
✅ Trọng số được cá nhân hóa cho từng người dùng và liên tục A/B thử nghiệm
✅ Các loại nội dung khác nhau (video so với văn bản) nhận được sự đối xử khác nhau
✅ Trọng số thay đổi dựa trên ngữ cảnh thời gian thực và trạng thái người dùng
Quy trình chấm điểm ví dụ:
1. Các mô hình ML dự đoán xác suất tương tác
2. Cờ tính năng cung cấp các hệ số trọng số hiện tại
3. Cá nhân hóa điều chỉnh trọng số cho từng người dùng
4. Ngữ cảnh thời gian thực sửa đổi điểm cuối cùng
5. Quy tắc kinh doanh áp dụng các cổng chất lượng và đa dạng
Điều Gì Thực Sự Khiến Nội Dung Trở Nên Viral
==================================
Dựa trên phân tích mã, các bài đăng viral thường:
1. Tạo Dự Đoán Tương Tác Cao:
- Các mô hình dự đoán xác suất thích/đăng lại/phản hồi cao
- Nội dung phù hợp với nhiều cộng đồng người dùng
- Tín hiệu tương tác sớm mạnh mẽ
2. Vượt Qua Tất Cả Các Cổng Chất Lượng:
- Sống sót qua 24 giai đoạn lọc khác nhau
- Đáp ứng tiêu chuẩn an toàn (không phải spam/NSFW/bạo lực)
- Tác giả có tín hiệu độ tin cậy tốt
3. Đạt Được Cá Nhân Hóa Ở Quy Mô:
- Phù hợp sở thích giữa các phân khúc người dùng đa dạng
- Kích hoạt sự tương đồng SimClusters cho nhiều người dùng
- Kết nối qua các mối quan hệ xã hội RealGraph
4. Tối Ưu Hóa Cho Cơ Chế Nền Tảng:
- Bao gồm phương tiện (hình ảnh/video hoạt động tốt hơn)
- Đăng trong các khoảng thời gian hoạt động cao
- Sử dụng định dạng khuyến khích phản hồi/đăng lại
Những Điều Chính Rút Ra
=============
✅ Dự đoán mức độ tương tác là tất cả - thuật toán tối ưu hóa cho các tương tác của người dùng
✅ Cá nhân hóa là tinh vi - sử dụng nhúng ML, không phải chỉ đơn giản là khớp từ khóa
✅ Lọc chất lượng là rộng rãi - 24 giai đoạn ngăn chặn nội dung chất lượng thấp
✅ Trọng số là động - liên tục được tối ưu hóa thông qua ML và A/B thử nghiệm
✅ Quy mô quan trọng - hệ thống xử lý hàng tỷ bài đăng hàng ngày với độ trễ <50ms
✅ Tính minh bạch tồn tại - phân tích này có thể thực hiện được vì X đã mã nguồn mở thuật toán
Hệ thống được thiết kế để hiển thị nội dung mà người dùng sẽ tương tác, tạo ra một vòng phản hồi thưởng cho những người sáng tạo hiểu biết về khán giả của họ và sản xuất nội dung hấp dẫn.
Dòng cuối: Tạo nội dung tạo ra sự tương tác chân thật từ khán giả mục tiêu của bạn. Thuật toán sẽ học và khuếch đại những gì hiệu quả.
234,8K
Hàng đầu
Thứ hạng
Yêu thích