Federated Learning verbessert Echtzeit-Aktionen-Erkennung in der Industrie

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In modernen Fertigungsumgebungen ist die präzise und sofortige Erkennung von Arbeitsaktionen entscheidend für Produktivität, Sicherheit und die Zusammenarbeit zwischen Mensch und Maschine. Traditionelle Ansätze zur Gestenerkennung basieren häufig auf zentralisierten Datensätzen, was in sensiblen Industrie‑Settings wegen Datenschutzbedenken problematisch ist.

Die neue Studie präsentiert ein federiertes Lernframework, das auf Pose‑basierten Daten acht relevanter Oberkörper‑Gesten abzielt. Die Daten wurden von fünf Probanden erfasst und mit einer angepassten FastPose‑Architektur verarbeitet. Für die zeitliche Analyse wurden zwei Modelle – ein LSTM und ein Transformer‑Encoder – unter vier Trainingsparadigmen getestet: zentral, lokal, federated averaging (FedAvg) und federated ensemble learning (FedEnsemble).

Ergebnisse zeigen, dass das federierte Transformer-Modell die zentrale Variante um 12,4 Prozentpunkte übertrifft, während FedEnsemble einen Gewinn von 16,3 Prozentpunkten erzielt. Auf einem externen, bislang unbekannten Client übersteigen federated Modelle die zentrale Genauigkeit um 52,6  bzw. 58,3 Prozentpunkte. Diese Zahlen demonstrieren, dass federiertes Lernen nicht nur die Privatsphäre schützt, sondern die Generalisierung über verschiedene Nutzer hinweg deutlich verbessert.

Die Arbeit legt damit einen klaren Grundstein für skalierbare, datenschutzfreundliche Gestenerkennung in heterogenen industriellen Umgebungen und eröffnet neue Perspektiven für die intelligente Unterstützung von Arbeitern.

Ähnliche Artikel