Ettin Reranker-Familie: 6 CrossEncoder-Modelle von 17M bis 1B, SOTA in jeder Größenklasse

Hugging Face hat die Ettin-Reranker-Familie veröffentlicht: sechs CrossEncoder-Reranking-Modelle mit 17M bis 1B Parametern, die jeweils State-of-the-Art-Performance in ihrer Größenklasse erzielen. Aufgebaut auf Ettin-ModernBERT-Encoder-Backbones und trainiert auf ca. 143 Millionen Triples, deckt die Familie ein breites Spektrum an Inferenzbudget-Anforderungen ab. Das vollständige Trainingsrezept wird zusammen mit den Modellgewichten öffentlich veröffentlicht.

Warum das wichtig ist

Ein SOTA-Reranker mit 17M Parametern ist in latenzempfindlichen oder speicherlimitierten Umgebungen einsetzbar, in denen größere Reranker unpraktikabel sind. Die vollständige Veröffentlichung des Trainingsrezepts eröffnet Teams zudem einen offenen Weg zum domänenadaptierten Fine-Tuning – ungewöhnlich für eine veröffentlichte SOTA-Modellfamilie.