Słyszałem, że lubisz GGUFs i MLX. Nasz nowo wydany reranker listowy, jina-reranker-v3, jest teraz dostępny w dynamicznie kwantyzowanych GGUFs i MLX. Sprawdź naszą🤗 kolekcję, aby zobaczyć wagi i raport arxiv:
Ostatnie, ale nie spóźnione: jina-reranker-v3 jest tutaj! Nowy 0.6B-parametrowy reranker listowy, który umieszcza zapytanie i wszystkie dokumenty kandydatów w jednym oknie kontekstowym i osiąga SOTA na BEIR. Nazywamy tę nową interakcję zapytanie-dokument "ostatnie, ale nie spóźnione" - jest "ostatnie", ponieważ <|doc_emb|> jest umieszczone jako ostatni token każdego dokumentu do ekstrakcji osadzenia. Jest "nie spóźnione", ponieważ, w przeciwieństwie do modeli interakcji spóźnionej, tj. ColBERT, które osobno kodują dokumenty przed dopasowaniem wielowektorowym, umożliwiamy interakcje zapytanie-dokument-dokument wcześnie w przebiegu do przodu.