Hierarchische Suche mit OOV-Anfragen: Erfolgreiche Methode für SNOMED CT

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Eine neue Studie zeigt, wie man in der umfangreichen medizinischen Ontologie SNOMED CT auch mit Begriffen findet, die im Vokabular der Ontologie nicht vorkommen. Durch den Einsatz von Sprachmodell-basierten Ontologie‑Embeddings gelingt es, die direktesten Oberbegriffe (Subsumers) und weitere relevante Vorfahren zu identifizieren, selbst wenn die Suchanfrage keine exakte Übereinstimmung besitzt.

Die Forscher haben ein spezielles OOV‑Query‑Set erstellt, das systematisch gegen SNOMED‑CT‑Konzepte annotiert wurde. Bei der Evaluation übertrifft die neue Methode die gängigen Baselines, darunter SBERT sowie zwei klassische lexikalische Matching‑Ansätze. Das Ergebnis unterstreicht, dass die Kombination aus semantischer Embedding‑Technologie und hierarchischer Struktur die Suche in komplexen Ontologien deutlich verbessert.

Obwohl die Tests ausschließlich an SNOMED CT durchgeführt wurden, ist die Herangehensweise generisch und lässt sich leicht auf andere Ontologien übertragen. Der komplette Code, die Tools und die Evaluationsdaten stehen auf GitHub zur Verfügung, sodass die Forschungsgemeinschaft die Methode sofort nutzen und weiterentwickeln kann.

Ähnliche Artikel