Neue Methode reduziert Latenz bei Mehrsprecher-Tracking mit kurzen Embeddings
Forscher haben einen neuen Ansatz entwickelt, der die Latenz beim Tracking mehrerer Sprecher drastisch senkt. Durch die gezielte Nutzung von kurzen Sprecher‑Embeddings, die in Echtzeit aus kurzen Audiosegmenten extrahiert werden, kann das System die Identität der Sprecher schneller und genauer zuordnen.