DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi

Trend Olan Konular

elvis

Yapay Zeka Ajanları ile İnşa @dair_ai • Önce: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • LLM'ler ve AI Ajanları ⬇️ ile nasıl inşa edileceği hakkında görüşler paylaşıyorum

Google, çok ajanlı sistemler için etkili bağlam mühendisliği üzerine bir harika rehber yayınladı. Buna dikkat edin, yapay zeka geliştiriciler! (yer imlerine işaret ediyor) İşte temel çıkarımlarım: Bağlam pencereleri darboğaz değil. Bağlam mühendisliği ise. Daha karmaşık ve uzun ufuklu sorunlar için, bağlam yönetimi basit bir "dizi manipülasyonu" problemi olarak ele alınamaz. Bugün ajan sistemlerinde bağlamı yönetmek için varsayılan yaklaşım, her şeyi prompta doldurmak olarak kalmaktadır. Daha fazla tarih, daha fazla jeton, daha fazla kafa karışıklığı. Çoğu takım bağlamı bir dizi birleştirme problemi olarak ele alır. Ancak ham bağlam dökümleri üç kritik başarısızlık yaratır: > tekrarlayan bilgilerden kaynaklanan maliyet patlaması > "ortada kaybolmuş" etkilerinden kaynaklanan performans düşüşü > ajanların bir sistem genelinde eylemleri yanlış atfettiğinde halüsinasyon oranlarında artış Bağlam yönetimi, depolama ve hesaplama ile birlikte mimari bir konu haline gelir. Bu, açık dönüşümlerin ad-hoc dize birleştirmesinin yerini aldığı anlamına gelir. Ajanlar varsayılan olarak gerekli minimum bağlamı alır ve araçlar aracılığıyla açıkça ek bilgi talep ederler. Google'ın Agent Development Kit'i gerçekten bağlam yönetimi üzerine derinlemesine düşünüyor gibi görünüyor. Bağlamı, "durumlu bir sistem üzerinde derlenmiş bir görünüm" olarak ele alan katmanlı bir mimari sunar; bu da bir prompt-stuffing aktivitesi olarak değil. Bu nasıl görünüyor? 1) Yapı: Kademeli Model Çerçeve, depolamadan sunumu dört farklı katman arasında ayırır: 1) Çalışma Bağlamı, geçici çağrı başına görüşleri yönetir. 2) Oturum, dayanıklı olay günlüğünü tutar, her mesajı, araç çağrısını ve kontrol sinyalini yakalar. 3) Hafıza, tek seanslardan daha uzun ömürlü arama yapılabilir bilgi sağlar. 4) Eserler, büyük ikili verileri hatlı gömme yerine versiyonlu referanslar aracılığıyla yönetir. Bağlam derleme aslında nasıl çalışır? Belirli işlemcilerle sıralı LLM akışları üzerinden çalışır. Bir içerik işlemcisi üç işlem gerçekleştirir: seçim alakasız olayları filtreler, dönüşüm olayları doğru şekilde kaydedilmiş İçerik nesnelerine düzleştirir ve enjeksiyon biçimlendirilmiş geçmişi LLM talebine yazar. İçerik işlemcisi esasen bir oturum ile çalışma bağlamı arasında köprüdür. Mimari, önek önbelleğini bağlamı kararlı öneklere (komutlar, kimlik, özetler) ve değişken eklerine (son dönemler, araç çıktıları) bölerek uygular. Bunun üstüne, static_instruction ilkel sistem istemleri için değişmezlik garanti eder ve çağrılar arasında önbellek geçerliliğini korur. 2) Önemli Olanın Ajanik Yönetimi Yapıyı çözdüğünüzde, temel zorluk önemlilik olur. Şu anda aktif pencerede neyin olması gerektiğini bulmanız gerekiyor. ADK, bu sorunu insan tarafından tanımlanan mimari ile ajanik karar alma arasındaki iş birliğiyle yanıt verir. Mühendisler, verinin nerede yaşadığını ve nasıl özetlendiğini tanımlar. Ajanlar, belirli bellek blokları veya eserler için ne zaman "ulaşacaklarınına" dinamik olarak karar verir. Büyük yükler için ADK bir tutuk deseni uygular. 5MB CSV veya devasa JSON yanıtı, prompt değil, artefakt depolamasında kalıyor. Ajanlar varsayılan olarak yalnızca hafif referansları görür. Ham veri gerektiğinde, geçici genişletme için LoadArtifactsTool çağırılır. Görev tamamlandığında, eser boşalır. Bu, kalıcı bağlam vergisini kesin, talep üzerine erişime dönüştürür. Uzun vadeli bilgi için MemoryService iki alma deseni sunar: 1) Tepkisel hatırlama: ajanlar bilgi boşluklarını fark eder ve korpusu açıkça arar. 2) Proaktif geri çağırma: ön işlemciler kullanıcı girdisi üzerine benzerlik araması yapar ve model çağrısından önce ilgili parçaları enjekte eder. Ajanlar, şimdiye kadar yaptıkları her konuşmayı taşımak yerine, mevcut aşama için gereken parçaları tam olarak hatırlar. Tüm bunlar bana Claude Skills'e yönelik kademeli yaklaşımı hatırlatıyor; bu yaklaşım Claude Code'da bağlamın verimli kullanımını iyileştiriyor. 3) Çok Ajanlı Bağlam Tek ajanlı sistemler bağlam bozukluğundan muzdarip olur. Çok ajanlar oluştururken bu sorun daha da büyüyor ve daha fazla alt ajan dahil edildikçe kolayca "bağlam patlaması"na yol açıyor. Çok ajanlı koordinasyonun etkili çalışması için ADK iki desen sunar. Ajanlar-araç olarak, uzmanlaşmış ajanları atalarının geçmişi olmayan, odaklanmış promptlar alan çağrılabilir kişiler olarak ele alır. Ajan Transfer, alt ajanların oturum görünümlerini devraldığı tam kontrol handofflarını sağlar. include_contents parametre, bağlam akışını kontrol eder, varsayılan olarak tam çalışma bağlamına geçer veya sadece yeni komut sağlar. Ajan teslim sırasında halüsinasyonu ne önler? Çözüm ise konuşma çevirisi. Önceki Asistan mesajları, atıf etiketleriyle anlatı bağlama dönüştürülür. Diğer ajanlardan gelen araç çağrıları açıkça işaretlenmiştir. Her ajan, sistemin daha geniş geçmişini kendisine yanlış atfetmeden Asistan rolünü üstlenir. Son olarak, bu içgörüleri uygulamak için Google ADK kullanmanıza gerek yok. Bence bu sorunlar çoklu ajanlı sistemler kurarken her alanda geçerli olabilir. (Görsel Nano Banana Pro'nun izniyle)

En İyiler

Sıralama

Takip Listesi