SMoG: Schema Matching auf Graphen – Effizient und erklärbar

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In der medizinischen Datenintegration ist die Zuordnung von unterschiedlichen elektronischen Gesundheitsakten (EHR) zu Standardmodellen wie OMOP CDM von entscheidender Bedeutung. Traditionelle Ansätze nutzen große Sprachmodelle (LLMs), die zwar vielversprechend wirken, aber häufig Halluzinationen erzeugen und nicht immer aktuelles Fachwissen besitzen.

Wissensgraphen (KGs) bieten hier eine verlässliche Alternative, indem sie strukturierte, überprüfbare Informationen bereitstellen. Bisherige KG-gestützte LLM-Methoden setzen jedoch auf aufwändige Mehrschritt-Abfragen oder speicherintensive Vektor‑Retrieval‑Techniken, was die Skalierbarkeit einschränkt.

Das neue Framework SMoG (Schema Matching on Graph) löst dieses Problem, indem es wiederholte, einfache 1‑Hop‑SPARQL‑Abfragen nutzt – ein Ansatz, der sich bereits in der Wissensgraphen‑Fragebeantwortung bewährt hat. Durch die direkte Abfrage von SPARQL‑Endpunkten reduziert SMoG den Speicherbedarf erheblich und liefert gleichzeitig nachvollziehbare, menschlich überprüfbare Abfragepfade.

Experimentelle Tests auf realen medizinischen Datensätzen zeigen, dass SMoG die Leistung von führenden Baselines erreicht, ohne dabei die Effizienz zu opfern. Damit demonstriert das System, dass KG‑gestützte Schema‑Matching‑Methoden sowohl leistungsfähig als auch praktikabel sein können.

Ähnliche Artikel