Escuché que te gustan los GGUF y MLX. Nuestro reranker listwise recientemente lanzado, jina-reranker-v3, ahora está disponible en GGUF cuantificados dinámicos y MLX. Echa un vistazo a nuestra🤗 colección para ver los pesos y el informe arxiv:
Último pero no tarde: ¡jina-reranker-v3 está aquí! Un nuevo reranker de lista de parámetros 0.6B que coloca la consulta y todos los documentos candidatos en una ventana de contexto y SOTA en BEIR. Llamamos a esta nueva interacción consulta-documento "última pero no tardía": es "última" porque <|doc_emb|> se coloca como el token final de cada documento para incrustar la extracción. "No es tarde" porque, a diferencia de los modelos de interacción tardía, es decir, ColBERT que codifican documentos por separado antes de la coincidencia multivectorial, habilitamos las interacciones consulta-documento-documento al principio del paso hacia adelante.