بنى باحثون من Meta نهجا جديدا ل RAG من يقول: - يتفوق على LLaMA في 16 معيارا من معايير RAG. - لديه 30.85 مرة أسرع من وقت الرمز المميز الأول. - يعالج 16x أكبر من نوافذ السياق. - ويستخدم 2-4 أضعاف الرموز المميزة. إليك المشكلة الأساسية في إعداد RAG النموذجي الذي تحله Meta: معظم ما نسترده في إعدادات RAG لا يساعد أبدا LLM. في RAG الكلاسيكي، عند وصول طلب بحث: - تقوم بترميزه في متجه. - اجلب أجزاء مماثلة من متجه DB. - قم بتفريغ السياق الذي تم استرداده في LLM. عادة ما يعمل ، ولكن بتكلفة باهظة: - تحتوي معظم الأجزاء على نص غير ذي صلة. - يجب على LLM معالجة المزيد من الرموز المميزة. - أنت تدفع مقابل الحوسبة وزمن الوصول والسياق. هذه هي المشكلة بالضبط التي تحلها طريقة REFRAG الجديدة من الذكاء الاصطناعي من Meta. إنه يعيد التفكير بشكل أساسي في الاسترجاع ويشرح الرسم البياني أدناه كيفية عمله. بشكل أساسي ، بدلا من تغذية LLM لكل جزء وكل رمز مميز ، يقوم REFRAG بضغط السياق وتصفيته على مستوى المتجه: - ضغط القطعة: يتم ترميز كل جزء في تضمين مضغوط واحد ، بدلا من مئات من عمليات تضمين الرموز المميزة....