MHSNet: Hierarchisches Semantik-Netzwerk erkennt Duplikate in Lebensläufen präzise
Recruiter stehen vor der Herausforderung, aus unvollständigen und fehlerhaften Lebensläufen, die von Plattformen wie LinkedIn oder Indeed bezogen werden, qualifizierte Kandidaten zu identifizieren. Um die Qualität des internen Talentpools zu erhöhen, ist eine zuverlässige Duplikaterkennung unerlässlich, doch die semantische Komplexität, die strukturelle Vielfalt und die Informationslücken in den Texten machen dies schwierig.
Die neue Methode namens MHSNet bietet einen mehrstufigen Identitätsverifizierungsrahmen, der das vortrainierte Modell BGE‑M3 mithilfe von kontrastivem Lernen feinabstimmt. Durch den Einsatz eines Mixture‑of‑Experts (MoE) erzeugt MHSNet gleichzeitig spärliche und dichte Repräsentationen auf mehreren Ebenen, wodurch semantische Ähnlichkeiten zwischen Lebensläufen präziser berechnet werden können.
Ein besonderer Fokus liegt auf dem state‑aware MoE, das speziell dafür entwickelt wurde, mit unvollständigen Lebensläufen umzugehen. Dieses Feature ermöglicht es dem Netzwerk, fehlende Informationen zu kompensieren und dennoch robuste Ähnlichkeitswerte zu liefern.
Experimentelle Ergebnisse aus der Veröffentlichung zeigen, dass MHSNet die Genauigkeit der Duplikaterkennung deutlich steigert und damit Unternehmen dabei unterstützt, ihren Talentpool effizienter zu verwalten.