تم الكشف عن البنية التقنية ل DeepSeek-v4 مسبقا! الجميع يعلم أن بنية MoE النموذجية الكبيرة الحالية تدمج قدرة الذكاء الاصطناعي على التفكير ومعرفته في كل خبير، فهل من الممكن أن يستخدمها الخبراء فقط للتفكير، ثم يخزنون كمية كبيرة من المعرفة الخارجية في مجال محدد، ليشكلوا بنية مثل السايبورغ الموصوفة في Ghost in the Shell، والتي تتكون فعليا من دماغ إلكتروني + ذاكرة خارجية؟ DeepSeek فعلت ذلك!