Ich habe gehört, du magst GGUFs und MLX. Unser neu veröffentlichter listwise Reranker, jina-reranker-v3, ist jetzt in dynamisch quantisierten GGUFs und MLX verfügbar. Schau dir unsere🤗 Sammlung für die Gewichte und den arxiv-Bericht an:
Last but not late: jina-reranker-v3 ist da! Ein neuer 0,6B-Parameter Listwise-Reranker, der die Abfrage und alle Kandidatendokumente in einem Kontextfenster zusammenführt und SOTA auf BEIR erreicht. Wir nennen diese neue Abfrage-Dokument-Interaktion "last but not late" - Es ist "last", weil <|doc_emb|> als das letzte Token jedes Dokuments für die Einbettungsextraktion platziert wird. Es ist "not late", weil wir im Gegensatz zu späten Interaktionsmodellen, d.h. ColBERT, die Dokumente separat vor der Multi-Vektor-Übereinstimmung kodieren, die Abfrage-Dokument-Dokument-Interaktionen früh im Vorwärtsdurchlauf ermöglichen.