المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
أنا حقا أحب هذا الاتجاه البحثي!
لفترة طويلة ، كنت أتحدث عن تشبيه "الدماغ مقابل قاعدة البيانات" بين SSMs مقابل Transformers. امتداد لهذا الذي ذكرته عدة مرات هو أنني أعتقد أن المقايضات تتغير عندما نبدأ في التفكير في بناء * أنظمة * متعددة المكونات بدلا من نماذج فردية.
على سبيل المثال ، إذا اشترك المرء في الحدس القائل بأن النماذج الهجينة الحديثة تستخدم SSM كوحدة معالجة رئيسية "شبيهة بالدماغ" بينما ينصب الاهتمام بشكل أساسي على التخزين المؤقت "الشبيه بقاعدة البيانات" للمساعدة في الاسترجاع الدقيق ، فافترضت أنه ربما يكون النظام الأمثل هو نموذج لغة SSM خالص جنبا إلى جنب مع قواعد بيانات المعرفة الخارجية الصريحة وذاكرة التخزين المؤقت للسياق. هذا أكثر تشابها مع الذكاء الشبيه بالإنسان الذي يقوده الدماغ بشكل أساسي (SSM) بمساعدة مخازن المعرفة الخارجية (الكتب والإنترنت) واستخدام الأدوات.
تظهر هذه الورقة نتائج مثيرة للاهتمام مفادها أن SSMs يبدو أنها تتمتع بأداء إيجابي للغاية مقارنة بالمحولات في هذا النظام من النماذج الوكيل التي تعمل باستخدام الأدوات التفاعلية. سعيد لرؤية الحدس تم التحقق من صحته ، وآمل أن يستمر المزيد من البحث على هذا المنوال!
الأفضل
المُتصدِّرة
التطبيقات المفضلة

