Eu construí um sistema RAG que consulta 36M+ vetores em <0,03 segundos. A técnica usada torna a memória RAG 32x eficiente! Confira o detalhamento com o código abaixo:
Avi Chawla
Avi Chawla4 de ago., 14:33
A simple technique makes RAG ~32x memory efficient! - Perplexity uses it in its search index - Azure uses it in its search pipeline - HubSpot uses it in its AI assistant Let's understand how to use it in RAG systems (with code):
45,1K