DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Saya baru saja melihat lebih dalam MiroThinker 1.5, dan metode kompresi agen mereka agak jahat, tetapi saya memahaminya dan berpikir itu sangat berguna. Kernel memecahkan masalah "cara menjejalkan 400 alat menggunakan dalam konteks 256K". Mereka melakukan sesuatu yang sangat berani: secara fisik menutupi Observasi (alat mengembalikan hasilnya) dalam pikiran-tindakan-pengamatan dalam sejarah ReAct. Kecuali untuk putaran K baru-baru ini untuk mempertahankan teks asli, ratusan Hasil Alat sebelumnya semuanya telah diganti dengan kalimat "Hasil alat dihilangkan untuk menyimpan token". Tapi semuanya tetap utuh<thought>. Ada bagian yang sangat berlawanan dengan intuisi dari ini, agen ini sendiri sedang melakukan penelitian mendalam, jadi dia hanya menyimpan teks asli dari putaran K terakhir, yaitu putaran ke-5, dan tidak ada seorang pun di depannya, bagaimana dia bisa menjawab pertanyaan itu. Ini memiliki premis yang sangat tidak jelas tetapi penting: selama pemikiran itu cukup padat, itu sebenarnya mendekati Ringkasan tanpa batas. Setiap generasi Pikiran pada dasarnya adalah sepotong informasi dari model untuk pengamatan saat ini. Ketika T1 dihasilkan, data kunci dalam O1 telah "dimakan" ke dalam otak. Sementara O1 diganti dengan placeholder, T1 tetap ada. T1 menjadi "paket kompresi informasi" O1. Tidak perlu melampirkan Agen Ringkasan tambahan, rantai Pemikiran lengkap ini sendiri adalah "ringkasan dinamis" fidelitas tinggi yang terus diperbarui secara bertahap.

Teratas

Peringkat

Favorit