Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elvis
Yapay Zeka Ajanları ile İnşa @dair_ai • Önce: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • LLM'ler ve AI Ajanları ⬇️ ile nasıl inşa edileceği hakkında görüşler paylaşıyorum
Google, çok ajanlı sistemler için etkili bağlam mühendisliği üzerine bir harika rehber yayınladı.
Buna dikkat edin, yapay zeka geliştiriciler! (yer imlerine işaret ediyor)
İşte temel çıkarımlarım:
Bağlam pencereleri darboğaz değil. Bağlam mühendisliği ise.
Daha karmaşık ve uzun ufuklu sorunlar için, bağlam yönetimi basit bir "dizi manipülasyonu" problemi olarak ele alınamaz.
Bugün ajan sistemlerinde bağlamı yönetmek için varsayılan yaklaşım, her şeyi prompta doldurmak olarak kalmaktadır. Daha fazla tarih, daha fazla jeton, daha fazla kafa karışıklığı. Çoğu takım bağlamı bir dizi birleştirme problemi olarak ele alır.
Ancak ham bağlam dökümleri üç kritik başarısızlık yaratır:
> tekrarlayan bilgilerden kaynaklanan maliyet patlaması
> "ortada kaybolmuş" etkilerinden kaynaklanan performans düşüşü
> ajanların bir sistem genelinde eylemleri yanlış atfettiğinde halüsinasyon oranlarında artış
Bağlam yönetimi, depolama ve hesaplama ile birlikte mimari bir konu haline gelir. Bu, açık dönüşümlerin ad-hoc dize birleştirmesinin yerini aldığı anlamına gelir. Ajanlar varsayılan olarak gerekli minimum bağlamı alır ve araçlar aracılığıyla açıkça ek bilgi talep ederler.
Google'ın Agent Development Kit'i gerçekten bağlam yönetimi üzerine derinlemesine düşünüyor gibi görünüyor. Bağlamı, "durumlu bir sistem üzerinde derlenmiş bir görünüm" olarak ele alan katmanlı bir mimari sunar; bu da bir prompt-stuffing aktivitesi olarak değil.
Bu nasıl görünüyor?
1) Yapı: Kademeli Model
Çerçeve, depolamadan sunumu dört farklı katman arasında ayırır:
1) Çalışma Bağlamı, geçici çağrı başına görüşleri yönetir.
2) Oturum, dayanıklı olay günlüğünü tutar, her mesajı, araç çağrısını ve kontrol sinyalini yakalar.
3) Hafıza, tek seanslardan daha uzun ömürlü arama yapılabilir bilgi sağlar.
4) Eserler, büyük ikili verileri hatlı gömme yerine versiyonlu referanslar aracılığıyla yönetir.
Bağlam derleme aslında nasıl çalışır? Belirli işlemcilerle sıralı LLM akışları üzerinden çalışır. Bir içerik işlemcisi üç işlem gerçekleştirir: seçim alakasız olayları filtreler, dönüşüm olayları doğru şekilde kaydedilmiş İçerik nesnelerine düzleştirir ve enjeksiyon biçimlendirilmiş geçmişi LLM talebine yazar.
İçerik işlemcisi esasen bir oturum ile çalışma bağlamı arasında köprüdür.
Mimari, önek önbelleğini bağlamı kararlı öneklere (komutlar, kimlik, özetler) ve değişken eklerine (son dönemler, araç çıktıları) bölerek uygular. Bunun üstüne, static_instruction ilkel sistem istemleri için değişmezlik garanti eder ve çağrılar arasında önbellek geçerliliğini korur.
2) Önemli Olanın Ajanik Yönetimi
Yapıyı çözdüğünüzde, temel zorluk önemlilik olur.
Şu anda aktif pencerede neyin olması gerektiğini bulmanız gerekiyor.
ADK, bu sorunu insan tarafından tanımlanan mimari ile ajanik karar alma arasındaki iş birliğiyle yanıt verir. Mühendisler, verinin nerede yaşadığını ve nasıl özetlendiğini tanımlar. Ajanlar, belirli bellek blokları veya eserler için ne zaman "ulaşacaklarınına" dinamik olarak karar verir.
Büyük yükler için ADK bir tutuk deseni uygular. 5MB CSV veya devasa JSON yanıtı, prompt değil, artefakt depolamasında kalıyor. Ajanlar varsayılan olarak yalnızca hafif referansları görür. Ham veri gerektiğinde, geçici genişletme için LoadArtifactsTool çağırılır. Görev tamamlandığında, eser boşalır. Bu, kalıcı bağlam vergisini kesin, talep üzerine erişime dönüştürür.
Uzun vadeli bilgi için MemoryService iki alma deseni sunar:
1) Tepkisel hatırlama: ajanlar bilgi boşluklarını fark eder ve korpusu açıkça arar.
2) Proaktif geri çağırma: ön işlemciler kullanıcı girdisi üzerine benzerlik araması yapar ve model çağrısından önce ilgili parçaları enjekte eder. Ajanlar, şimdiye kadar yaptıkları her konuşmayı taşımak yerine, mevcut aşama için gereken parçaları tam olarak hatırlar.
Tüm bunlar bana Claude Skills'e yönelik kademeli yaklaşımı hatırlatıyor; bu yaklaşım Claude Code'da bağlamın verimli kullanımını iyileştiriyor.
3) Çok Ajanlı Bağlam
Tek ajanlı sistemler bağlam bozukluğundan muzdarip olur. Çok ajanlar oluştururken bu sorun daha da büyüyor ve daha fazla alt ajan dahil edildikçe kolayca "bağlam patlaması"na yol açıyor.
Çok ajanlı koordinasyonun etkili çalışması için ADK iki desen sunar. Ajanlar-araç olarak, uzmanlaşmış ajanları atalarının geçmişi olmayan, odaklanmış promptlar alan çağrılabilir kişiler olarak ele alır. Ajan Transfer, alt ajanların oturum görünümlerini devraldığı tam kontrol handofflarını sağlar. include_contents parametre, bağlam akışını kontrol eder, varsayılan olarak tam çalışma bağlamına geçer veya sadece yeni komut sağlar.
Ajan teslim sırasında halüsinasyonu ne önler? Çözüm ise konuşma çevirisi. Önceki Asistan mesajları, atıf etiketleriyle anlatı bağlama dönüştürülür. Diğer ajanlardan gelen araç çağrıları açıkça işaretlenmiştir. Her ajan, sistemin daha geniş geçmişini kendisine yanlış atfetmeden Asistan rolünü üstlenir.
Son olarak, bu içgörüleri uygulamak için Google ADK kullanmanıza gerek yok. Bence bu sorunlar çoklu ajanlı sistemler kurarken her alanda geçerli olabilir.
(Görsel Nano Banana Pro'nun izniyle)

1,21K
ORTAM ÖLÇEKLENDIRME DURUMU //
Çevresel ölçeklendirme, ajanik yapay zeka için model ölçeklendirme kadar önemli olabilir.
Mevcut yapay zeka araştırmaları, güçlü bir ajanik yapay zeka modeli oluşturmanın sadece daha iyi akıl yürütmeyle ilgili olmadığını gösteriyor. Aynı zamanda daha iyi ortamlarla ilgili.
Yetenekli yapay zeka ajanlarını eğitmenin varsayılan yaklaşımı, statik yörüngeler veya insan gösterimleri toplamaktır. Bu daha fazla veri, daha fazla örnek ve daha fazla açıklama çabası gerektirir.
Ama statik veriler dinamik karar vermeyi öğretemez. Bu şekilde eğitilen modeller, gerçek ajanik görevlerin uzun ufuklu, hedef odaklı doğasıyla mücadele eder.
Bu yeni araştırma, sadece veri ölçeklendirmek yerine etkileşimli eğitim ortamlarının çeşitliliğini ve karmaşıklığını sistematik olarak ölçekleyen Nex-N1 çerçevesini tanıtıyor.
Ajan yetenekleri taklit değil, etkileşimden ortaya çıkar. Daha fazla gösterim toplamak yerine, doğal dil spesifikasyonlarından otomatik olarak çeşitli ajan mimarileri ve iş akışları oluşturacak altyapı inşa ettiler.
Sistemin üç bileşeni vardır. NexAU (Ajan Evreni), basit yapılandırmalardan karmaşık ajan hiyerarşileri üreten evrensel bir ajan çerçevesi sunar. NexA4A (Ajan for Agent) doğal dilden çeşitli ajan mimarilerini otomatik olarak sentezler. NexGAP, gerçek dünya MCP araçlarını entegre ederek simülasyon-gerçeklik boşluğunu kapatarak yere dayalı yörünge sentezi sağlar.
Sonuç -ları:
- τ2-bench'te, DeepSeek-V3.1 üzerine inşa edilen Nex-N1, 80.2 puan alır ve temel modelin 42.8'ini geride bırakır.
- SWE-bench Verified'de, Qwen3-32B-Nex-N1 %50,5 oranına ulaşırken, temel modelin %12,9'u vardır.
- Araç kullanımı için BFCL v4'te Nex-N1 (65.3) GPT-5'i (61.6) geride bırakıyor.
43 kodlama senaryosunda gerçek dünya proje geliştirme insan değerlendirmelerinde, Nex-N1 %64,5'te Claude Sonnet 4.5'e karşı kazanır veya berabere kalır, GPT-5'e karşı ise ~%70'inde başarır.
Ayrıca Nex-N1 üzerinde derin bir araştırma ajanı geliştirdiler; Derin Araştırma Kıyaslaması'nda %47,0 oran elde ettiler; slaytlar ve araştırma posterleri dahil olmak üzere görselleştirilmiş rapor oluşturma yeteneklerine sahipler.
Kâğıt:

9,21K
En İyiler
Sıralama
Takip Listesi


