📢 إصدار أحدث بحثنا
تم اختياره لورشة عمل @AAAI 26.
نظهر أن قدرة نماذج اللغة الكبيرة على التنبؤ بأسئلة العالم الحقيقي من أسواق التنبؤ (مثل الأسواق المتعددة) تختلف بشكل كبير حسب الفئة.
👉 تظهر طريقتنا أنه بينما يساعد إضافة الأخبار، فإنه يضيف أيضا بعض أنماط الفشل مثل انحراف التعريف، تحيز الحداثة وإرساء الشائعات
📢 إصدار أحدث ورقنا
تم اختياره @NeurIPSConf ورشة عمل حول التفكير الفعال!
نوضح أن طريقة تحجيم وقت الاختبار المثلى هي التنقيح بشكل متكرر من خلال خطوات متسلسلة.
👉 تتفوق طريقتنا على تصويت الأغلبية بواسطة السلاسل المتوازية في 95٪ من التكوينات مع مكاسب دقة تصل إلى 46.7٪ في الحوسبة المتطابقة.