"0G làm thế nào để thực hiện AI phổ cập?" Từ "đế chế" không phải là mới trong thời hiện đại, chẳng hạn như đế chế đô la, đế chế chip, v.v. Trong thế kỷ 21, nơi công nghệ phát triển nhanh chóng, AI là thành quả tiên tiến nhất của xã hội loài người @0G_labs AI phụ thuộc nhiều nhất vào mô hình, việc huấn luyện mô hình hiện nay không phải là vấn đề kỹ thuật, mà là vấn đề quyền lực tài nguyên. Chỉ có một số ít công ty sở hữu trung tâm siêu máy tính, băng thông cao và cụm GPU đồng bộ, việc huấn luyện một mô hình lớn 100B tham số, bản thân nó đã là một ranh giới quyền lực. 🟣 Và @0G_labs đang phá vỡ ranh giới này. DiLoCoX là vũ khí mới nhất mà 0G tung ra. Họ đã thành công hoàn thành việc huấn luyện phân tán một mô hình 107B tham số trong môi trường mạng chỉ có băng thông 1Gbps, sử dụng tài nguyên tính toán là một cụm gồm 160 chiếc A800. Không có siêu máy tính, không có kết nối quang học, không có địa điểm huấn luyện của các công ty lớn, thậm chí không có Infiniband. Cuối cùng, độ chính xác của mô hình mất mát dưới 0.5%, hiệu suất huấn luyện tăng hơn 357 lần so với kiến trúc AllReduce truyền thống. @0G_labs gọi nó là DiLoCoX, một khung huấn luyện phân tán được thiết kế riêng cho môi trường giao tiếp thấp. Điều quan trọng là: đã xây dựng một cơ chế huấn luyện có thể chịu đựng độ trễ, hỗ trợ bất đồng bộ, có thể tiến hành độc lập tại các địa điểm khác nhau và cuối cùng tổng hợp lại. Ý nghĩa của điều này không chỉ đơn thuần là tiết kiệm chi phí. 🟣 #0G phá vỡ quy trình xây dựng mô hình tập trung, mang lại sự linh hoạt trong ranh giới tham gia. Đối với hầu hết các quốc gia, doanh nghiệp và nhà phát triển, những điều trước đây không thể với tới, giờ đây: > Một trường đại học có thể hợp tác với mười doanh nghiệp nhỏ để cùng huấn luyện một mô hình chuyên ngành. > Một quốc gia châu Phi có thể triển khai hệ thống thông minh địa phương mà không cần AWS hay Google Cloud. > Một cộng đồng phân tán có thể phối hợp GPU và dữ liệu trên chuỗi, sử dụng tài sản thông minh làm động lực, thực hiện huấn luyện hợp tác dài hạn. Cuộc chiến AI hiện tại không nằm ở sản phẩm, mà ở tài nguyên. Dù bạn có kiến trúc thuật toán xuất sắc, nếu không thể huấn luyện hiệu quả, bạn sẽ mãi chỉ dừng lại ở giai đoạn nguyên mẫu hoặc tinh chỉnh. Và trong mô hình truyền thống, sự đồng bộ và băng thông mạng cần thiết cho việc huấn luyện, bản thân nó đã là một quả bom chi phí, cũng tạo thành thành trì cốt lõi của các nhà cung cấp đám mây trung tâm. DiLoCoX bắt đầu tách rời sự phụ thuộc này từ tầng dưới, thực hiện AI phổ cập thực sự.
2,36K