لقد ألقيت نظرة عميقة على MiroThinker 1.5، وطريقة ضغط الوكلاء لديهم شريرة بعض الشيء، لكنني أفهمها وأعتقد أنها مفيدة جدا. النواة تحل مشكلة "كيفية حشر 400 استخدام أداة في سياق 256 كيلوبايت". قاموا بشيء جريء للغاية: إخفاء الملاحظة فعليا (الأداة تعطي النتيجة) في التفكير-الفعل-الملاحظة في تاريخ ReAct. باستثناء جولة K الأخيرة التي احتفظت بالنص الأصلي، تم استبدال مئات نتائج الأدوات السابقة بالجملة "نتيجة الأداة حذف لحفظ الرموز". لكن جميعها محفوظة <thought>سليمة. هناك جانب غير منطقي جدا في هذا، فهذا العميل نفسه يقوم ببحث عميق، لذا يحتفظ فقط بالنص الأصلي من الجولة الأخيرة K، أي الجولة الخامسة، ولا يوجد أحد أمامها، كيف يمكنه الإجابة على السؤال. هذا له فرضية غامضة لكنها حاسمة: طالما أن الفكرة كثيفة بما فيه الكفاية، فهي في الواقع تقارب الملخص إلى ما لا نهاية. كل توليد للفكر هو في الأساس قطعة من المعلومات من النموذج للملاحظة الحالية. عندما تم توليد T1، كانت البيانات الأساسية في O1 قد تم "أكلها" بالفعل في الدماغ. بينما تم استبدال O1 بمؤقت، بقي T1. يصبح T1 "حزمة ضغط المعلومات" ل O1. لا حاجة لإرفاق وكيل ملخص إضافي، فهذه السلسلة الكاملة للأفكار هي ملخص ديناميكي عالي الدقة يتم تحديثه باستمرار تدريجيا.