المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
أول دراسة واسعة النطاق حول وكلاء الذكاء الاصطناعي الذين يعملون فعليا في الإنتاج.
الضجة تقول إن الوكلاء يغيرون كل شيء. البيانات تروي قصة مختلفة.
أجرى الباحثون مسحا ل 306 ممارسين وأجروا 20 دراسة حالة معمقة عبر 26 مجالا. ما وجدوه يتحدى الافتراضات الشائعة حول كيفية بناء وكلاء الإنتاج.
الواقع: وكلاء الإنتاج متعمدون أن يكونوا بسيطين ومقيدين بشدة.
1) الأنماط والموثوقية
- 68٪ ينفذون 10 خطوات كحد أقصى قبل الحاجة إلى تدخل بشري.
- 47٪ يكملون أقل من 5 خطوات.
- 70٪ تعتمد على النماذج الجاهزة دون أي تعديل دقيق.
- 74٪ يعتمدون بشكل أساسي على التقييم البشري.
الفرق تتعمد التخلي عن الاستقلالية مقابل الموثوقية.
لماذا هذه القيود؟ الموثوقية لا تزال التحدي الأكبر الذي لم يحل. لا يمكن للممارسين التحقق من صحة الوكيل على نطاق واسع. نادرا ما تنطبق المعايير العامة على مهام الإنتاج الخاصة بالمجال. 75٪ من الفرق التي تمت مقابلتها تقيم بدون معايير قياسية رسمية، معتمدة على اختبارات A/B وتعليقات مباشرة من المستخدم.
2) اختيار النماذج
فاجأ نمط اختيار النماذج الباحثين. 17 من أصل 20 دراسة حالة تستخدم نماذج الحدود المغلقة المصدر مثل كلود سونيت 4، كلود أوبوس 4.1، وGPT o3. اعتماد المصدر المفتوح نادر ومدفوع بقيود محددة: أعباء عمل عالية الحجم حيث تصبح تكاليف الاستدلال باهظة، أو متطلبات تنظيمية تمنع مشاركة البيانات مع مزودين خارجيين. بالنسبة لمعظم الفرق، تكاليف وقت التشغيل ضئيلة مقارنة بالخبراء البشريين الذين يضيفهم الوكيل.
3) أطر الوكلاء
يظهر تبني الإطار تنوعا واضحا. 61٪ من المشاركين في الاستطلاع يستخدمون أطر عمل من طرف ثالث مثل LangChain/LangGraph. لكن 85٪ من الفرق التي أجريت مقابلات معها مع عمليات الإنتاج تبني تطبيقات مخصصة من الصفر. والسبب: أن حلقات الوكيل الأساسية سهلة التنفيذ من خلال استدعاءات API المباشرة. تفضل الفرق السقالات البسيطة والمصممة خصيصا على طبقات التضخم والتجريد.
4) تدفق التحكم في العامل
تفضل بنى الإنتاج سير العمل الثابت المحدد مسبقا على الاستقلالية المفتوحة. 80٪ من دراسات الحالة تستخدم تدفق التحكم المنظم. يعمل الوكلاء ضمن مساحات عمل محددة النطاق بدلا من استكشاف بيئات بحرية. سمحت حالة واحدة فقط بالاستكشاف غير المقيد، وهذا النظام يعمل حصريا في بيئات مفتوحة مع تحقق صارم من CI/CD....

الأفضل
المُتصدِّرة
التطبيقات المفضلة

