Neues Maß für semantische Ähnlichkeit: recos übertrifft Cosinus

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die klassische Cosinus‑Ähnlichkeit, die auf der Cauchy‑Schwarz‑Ungleichung basiert, beschränkt sich auf lineare Zusammenhänge und kann die komplexen, nichtlinearen Strukturen realer semantischer Räume nicht vollständig erfassen. In einer neuen Studie wurde ein engeres Obergrenze für das Skalarprodukt hergeleitet, das die traditionelle Cauchy‑Schwarz‑Grenze übertrifft. Diese neue Grenze führt direkt zu recos, einer Ähnlichkeitsmetrik, die das Skalarprodukt durch die sortierten Komponenten der Vektoren normalisiert.

Im Gegensatz zur strengen linearen Abhängigkeit, die für perfekte Ähnlichkeit bei Cosinus erforderlich ist, erlaubt recos die Ordinalkonkordanz. Dadurch kann es ein breiteres Spektrum von Beziehungen erkennen und modellieren. Umfangreiche Experimente mit elf verschiedenen Einbettungsmodellen – darunter statische, kontextualisierte und universelle Typen – zeigen, dass recos die Cosinus‑Ähnlichkeit konsequent übertrifft. Es erzielt höhere Korrelationen mit menschlichen Urteilen auf den Standard‑Semantic‑Textual‑Similarity (STS) Benchmarks.

Die Ergebnisse demonstrieren, dass recos sowohl mathematisch fundiert als auch empirisch überlegen ist. Es bietet eine verbesserte Genauigkeit für semantische Analysen in komplexen Einbettungsräumen und stellt damit eine vielversprechende Alternative zur herkömmlichen Cosinus‑Ähnlichkeit dar.

Ähnliche Artikel