Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

yan5xu
🤖 Pemula AI
Saya baru saja melihat lebih dalam MiroThinker 1.5, dan metode kompresi agen mereka agak jahat, tetapi saya memahaminya dan berpikir itu sangat berguna.
Kernel memecahkan masalah "cara menjejalkan 400 alat menggunakan dalam konteks 256K".
Mereka melakukan sesuatu yang sangat berani: secara fisik menutupi Observasi (alat mengembalikan hasilnya) dalam pikiran-tindakan-pengamatan dalam sejarah ReAct.
Kecuali untuk putaran K baru-baru ini untuk mempertahankan teks asli, ratusan Hasil Alat sebelumnya semuanya telah diganti dengan kalimat "Hasil alat dihilangkan untuk menyimpan token". Tapi semuanya tetap utuh<thought>.
Ada bagian yang sangat berlawanan dengan intuisi dari ini, agen ini sendiri sedang melakukan penelitian mendalam, jadi dia hanya menyimpan teks asli dari putaran K terakhir, yaitu putaran ke-5, dan tidak ada seorang pun di depannya, bagaimana dia bisa menjawab pertanyaan itu.
Ini memiliki premis yang sangat tidak jelas tetapi penting: selama pemikiran itu cukup padat, itu sebenarnya mendekati Ringkasan tanpa batas.
Setiap generasi Pikiran pada dasarnya adalah sepotong informasi dari model untuk pengamatan saat ini. Ketika T1 dihasilkan, data kunci dalam O1 telah "dimakan" ke dalam otak.
Sementara O1 diganti dengan placeholder, T1 tetap ada. T1 menjadi "paket kompresi informasi" O1. Tidak perlu melampirkan Agen Ringkasan tambahan, rantai Pemikiran lengkap ini sendiri adalah "ringkasan dinamis" fidelitas tinggi yang terus diperbarui secara bertahap.

1
Tentang Rekayasa Konteks. Ada dua pertanyaan yang menurut saya dapat melihat tingkat orang secara khusus, dan saya bertanya kepadanya bagaimana merancang read_file write_file di bawah skenario bisnis XX. Jika Anda benar-benar hanya membaca dan menulis dokumen tertentu, Anda dapat mengakhiri di sini.
141
Antropik benar-benar penghubung antara teori dan praktik
Saat mengirim keterampilan, dua metode diusulkan: Prompt hierarkis loading/multiplexing, eksekusi kode & penggabungan API/mcp (manus menyebut pembongkaran konteks ini).
Sehari sebelum kemarin, saya memperbaiki kedua metode ini ke tingkat API inferensi, Tool Search Tool, yang memecahkan penemuan alat & pemuatan lambat, dan Programmatic Tool Calling untuk mengimplementasikan alat eksekusi kode. Saya merasa bahwa protokol 😂 API Anthropic memiliki kemungkinan besar untuk menggantikan OpenAI di masa depan
277
Teratas
Peringkat
Favorit
