VGG-16 erreicht 98 % Genauigkeit bei Handsignalerkennung für Gehörlose
Handgesten‑Erkennung ist ein zentrales Element der Mensch‑Computer‑Interaktion und bildet die Grundlage für die Gebärdensprache von Menschen mit Sehbehinderung.
In einer neuen Studie wurde ein innovatives System entwickelt, das das Convolutional‑Neural‑Network VGG‑16 nutzt. Das Modell wurde mit Python und Keras auf einem weit verbreiteten Bilddatensatz trainiert.
Zur Validierung wurde das NUS‑Dataset mit zehn Gestenklassen verwendet, während ein Test‑Set aus zehn weiteren Gesten durch die offene Google‑API generiert wurde.
Durch die Kombination von Transfer‑Learning und Bilddaten‑Augmentation erreichte das VGG‑16‑Net ein beeindruckendes Ergebnis von rund 98 % Genauigkeit.