zELO: Neue Trainingsmethode steigert Retrieval-Leistung von Rerankern

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die neu veröffentlichte Methode zELO nutzt ein statistisches Modell, um Rankingaufgaben als gleichwertig zu einem Thurstone-Modell zu betrachten. Durch diese Analyse können Retrieval-Modelle ohne manuelle Annotationsdaten optimiert werden.

Mit zELO wurden die Open-Weight-Reranker zerank-1 und zerank-1-small trainiert. Beide Modelle erzielen die besten Retrieval-Ergebnisse in diversen Fachbereichen wie Finanzen, Recht, Programmierung und Naturwissenschaften. Sie übertreffen dabei proprietäre, geschlossene Reranker sowohl bei NDCG@10 als auch bei Recall.

Ein besonderes Merkmal ist die Vielseitigkeit der Modelle: Sie behalten ihre 0‑Shot-Performance auch bei Daten aus völlig anderen Domänen sowie bei privaten Kundensätzen. Das Training basierte auf 112.000 unannotierten Suchanfragen und jeweils 100 Dokumenten pro Anfrage und wurde in weniger als 10.000 H100‑Stunden vollständig end-to-end durchgeführt.

Ähnliche Artikel