Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Robert Youssef
Vay canına... bu, şimdiye kadar gördüğüm 🤯 en gerçek dışı akademik yazarlık yükseltmesi olabilir
NUS'tan bir ekip, Overleaf'in içinde bulunan ve makalenizi gerçek zamanlı olarak yeniden yazan editör içi çoklu ajanlı sistem olan PaperDebugger'ı yeni başlattı.
Kopyala-yapıştır değil. Bir yan panel sohbet botu değil.
LaTeX düzenleyicinizde gerçek ajanik düzenleme.
İşte bunun neden çılgınca 👇 olduğunu
→ Dağınık bir paragrafı vurgularsınız ve tam bir eleştiri + yeniden yazma süreci başlatılır
→ Git gibi önce-sonrası farklılıklarını temiz döndürür, ardından belgenizi anında yamalar yapar
→, Reviewer, Enhancer, Skor ve Araştırmacı ajanlarını paralel olarak çalıştırıyor
→ Editör içinde çoklu ajanlı akıl yürütmeyi ölçeklendirmek için Kubernetes podları kullanır
→ Literatür arama, referans araması ve bölüm düzeyinde geliştirme için MCP araç zincirine dokunur
Derin araştırma modu ise daha da çılgın:
İlgili arXiv makalelerini çeker, özetler, yönteminizi onlarla karşılaştırır ve atıflara hazır tablolar oluşturur... Yazarken hepsi hata içinde.
Temelde, belgenizin yeniden yazılması, eleştiri, kaynak bulma ve cilalanma süreçlerine gömülen, akışı bozmadan küçük bir gözden geçirici komitesi gibi.
Eğer bu ölçeklenirse, Overleaf editörlük yapmayı bırakır... ve tam anlamıyla yapay zeka destekli bir araştırma ortamı haline gelir.

1,13M
Stanford Üniversitesi'nin gizli iş birliğiyle ilgili harika bir makalesi yeni yayınlandı ve bu, çoklu ajanlı zeka hakkındaki düşüncemizi sonsuza dek değiştiriyor.
"Çok Ajanlı Sistemlerde Gizli İş Birliği", ajanların iletişim kanalları, önceden tanımlanmış roller veya açık ekip çalışması talimatları olmadan koordinasyon yapabildiğini gösteriyor. Politika ağlarında sadece diğer ajanların anladığı gizli iç sinyaller icat ediyorlar.
Ortaya çıkanları izlemek çılgınca:
• Görev bölücülerin sıfır rehberlikle görev yapması
• Roller gizli alan içinde sessizce oluşuyor
• Zayıf ajanlar geri çekilirken güçlüler kontrolü ele geçiriyor
• Gözlemlenebilir eylemlerde hiç görünmeyen gizli müzakere sinyalleri
• Çevre değiştikçe değişen koordinasyon stratejileri
Dışarıdan basit görünen davranış aslında modellerin içinde oluşan tamamen gizli bir "dil"dir.
En şok edici kısmı mı?
Ajanlara iletişim aracı vermeden senaryoları test ettiler... ve yine de iş birliği ortaya çıktı. Tamamen antrenman baskısı ve paylaşılan ödüllerden kaynaklanıyordu.
İşte ajanik yapay zekanın nereye gittiğine dair bir bakış:
Mekanik değil, içgüdüsel olarak koordinasyon sağlayan takımlar.
Biyolojik sistemlerin iş birliği yaptığı gibi çalışan ajanlar, söylendiği için değil, stratejinin doğal olarak ortaya çıktığı için.
Otonom sistemler, pekiştirici öğrenme veya çoklu ajanlı yapay zeka ile ilgileniyorsanız... Bu kitap mutlaka okunması gereken bir kitap.

9,68K
🚨 DeepSeek çılgın bir şey yaptı.
Sadece problemleri çözmekle kalmıyor, kendi ispatlarını kontrol eden, kendini eleştiren, mantığı düzelten ve tek bir hata bulamayınca tekrar deneyen bir matematik model inşa ettiler.
Son kısım, kendi mantığını doğrulamadan önce doğrulayabilen bir modelin çığırı.
Ve sonuçlar saçma:
• IMO 2025'te altın seviyesinde performans
• CMO 2024'te altın seviyede performans
• Putnam 2024'te 118/120 neredeyse kusurlu, tüm insan puanlarını geçti
• En zor kategorilerde GPT-5 Thinking ve Gemini 2.5 Pro'dan üstün başarı gösterir
DeepSeek Math V2'yi çılgın yapan şey doğruluk değil, arkasındaki mimaridir.
Daha büyük modellerin ya da uzun düşünce zincirinin peşinden koşmadılar.
Bir ekosistem inşa ettiler:
✓ mantıksal boşlukları arayan özel bir doğrulayıcı
✓ doğrulayıcının halüsinasyon yapıp görmediğini kontrol eden bir meta-doğrulayıcı
✓ kötü akıl yürütmekten korkmayı öğrenen bir kanıt üreticisi
✓ ve modelin doğrulamayı geliştirmeye zorlayan daha zor kanıtlar ürettiği bir eğitim döngüsü
Döngü acımasız:
Oluşturun → Doğrulayın → Meta-doğrulama → Düzeltin → Tekrarlayın.
Çözdükleri temel mesele: nihai cevabın doğruluğu, teorem ispatında hiçbir şey ifade etmiyor. Doğru numarayı çöp mantıkla bulabilirsiniz. Bu yüzden bir doğrulayıcıyı kanıtın kendisini değerlendirmesi için eğittiler, nihai cevabı değil.
Cebir, geometri, kombinatorik, sayı teorisi ve eşitsizlikler arasında ispat doğruluğunu karşılaştıran grafik, DeepSeekMath-V2'nin GPT-5 Thinking ve Gemini 2.5 Pro'yu genel olarak geride bıraktığını gösteriyor (bu sayfa 7'de).
Vahşi kısmı sıralı kendini geliştirme. Her yinelemede, modelin kendi kanıt puanı yükseliyor çünkü insan geri bildirimi olmadan kendini hata ayıklıyor.
Bu "daha uzun düşünce zinciri" değil.
Bu "Doğru olduğuma emin olana kadar düşünmeye devam edeceğim."
Akıl yürütme modellerini nasıl eğittiğimizde gerçek bir değişim.
DeepSeek, doğal dilde kendini doğrulanabilir akıl yürütmenin mümkün olduğunu kanıtladı; resmi bir kanıt asistanı, insan izleri yok, sadece modelin kendi çıktısına güvenmemeyi öğrenmesi gerekiyor.
Eğer yapay zeka akıl yürütmeyi önemsiyorsanız, bu makale bir dönüm noktasıdır.

139,29K
En İyiler
Sıralama
Takip Listesi
