Ho sentito che ti piacciono i GGUF e gli MLX. La nostra nuova lista di riordino, jina-reranker-v3, è ora disponibile in GGUF e MLX quantizzati dinamicamente. Dai un'occhiata alla nostra🤗 collezione per i pesi e il report arxiv:
Ultimo ma non tardi: jina-reranker-v3 è qui! Un nuovo reranker listwise con 0,6 miliardi di parametri che mette la query e tutti i documenti candidati in un'unica finestra di contesto e SOTA su BEIR. Chiamiamo questa nuova interazione query-documento "ultimo ma non tardi" - È "ultimo" perché <|doc_emb|> è posizionato come l'ultimo token di ogni documento per l'estrazione dell'embedding. È "non tardi" perché, a differenza dei modelli di interazione tardiva, cioè ColBERT, che codificano separatamente i documenti prima del matching multi-vettore, noi abilitiamo le interazioni query-documento-documento precocemente nel passaggio in avanti.