Neues Bewertungsmaß für Dialogsegmentierung: Granularität statt F1
Die Bewertung von Dialogtopic‑Segmentierungssystemen wird seit Jahrzehnten von strengen Grenz‑Matching‑Regeln und F1‑Metriken dominiert. Doch moderne LLM‑basierte Chatbots nutzen Segmentierung zunehmend, um den Gesprächsverlauf über das feste Kontextfenster hinaus zu verwalten. In diesem Kontext führt die bisherige Praxis zu ineffizienter und weniger kohärenter Gesprächsführung.