LingVarBench: synthetische Telefontranskripte verbessern NER um bis zu 95 %
Die neue Plattform LingVarBench nutzt große Sprachmodelle, um realistische Telefontranskripte zu erzeugen und damit die automatisierte Erkennung von benannten Entitäten (NER) in Gesprächsaufzeichnungen deutlich zu steigern. Durch die Kombination von strukturierten Feldwerten, konversationellen Sätzen und automatischer Validierung kann die Pipeline tausende synthetische Transkripte generieren, die typische Telefonmerkmale wie Stottern, Unterbrechungen und Sprecherüberlappungen enthalten.