Vâng, tôi đang tìm hiểu kiến trúc dựa trên cả ICMS và Enfabrica. Đây là một loại thỏa thuận Mellanox. Nhưng NVLink sẽ bị tắc nghẽn xung quanh GPU, CPU và DPU. Nvidia cần đơn giản hóa việc truyền dữ liệu cho kv và trọng số.