Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
OCR kıyaslamaları önemlidir, bu yüzden bu blogda @jerryjliu0 en etkili belge OCR kıyaslamalarından biri olan OlmOCR-Bench'i analiz ediyor. Özet: doğru yönde önemli bir adım, ancak gerçek dünyadaki belge ayrıştırma ihtiyaçlarını tam olarak karşılamıyor.
📊 OlmOCR-Bench, ikili geçiş-başarısız testleri içeren 1400+ PDF'yi kapsar, ancak akademik makalelere (%56) odaklanır ve faturalar, formlar ve mali tablolar eksiktir
🔍 Benchmark'ın birim testleri karmaşık tablolar ve okuma sırası için çok kaba ve birleştirilmiş hücreler, grafik anlayışı ve küresel belge yapısı eksiktir
⚡ Testlerde tam dize eşleştirmesi, küçük biçimlendirme farklılıklarının hata yarattığı kırılganlık yaratır; hatta çıkarma anlamsal olarak doğru olsa bile,
🏗️ Model yanlılığı, kıyaslamanın test vakaları oluşturmak için Sonnet ve Gemini kullanması nedeniyle vardır; bu da benzer çıktılarda eğitilen modellere avantaj sağlar
Ön testlerimiz, LlamaParse'ın rakamlar, diyagramlar ve karmaşık iş belgeleri üzerinde derin görsel akıl yürütmede parladığını gösteriyor.
OCR kıyaslama zorluklarına dair Jerry's analizimizi ve bir sonraki nesil belge ayrıştırma değerlendirmesinin nasıl olması gerektiğini okuyun:

En İyiler
Sıralama
Takip Listesi

