Datensatz-Pruning macht Edge-Lernen energieeffizient
Edge-Lernen verspricht, Intelligenz direkt auf den Geräten zu trainieren, die Daten erzeugen. Dadurch sinken Datenschutzrisiken und Kommunikationslatenz, doch die hohen Rechen- und Energieanforderungen behindern die Nutzung auf batteriebetriebenen Mobilgeräten mit engen thermischen und Speichergrenzen.
Während frühere Studien vor allem die Modellarchitektur für effizientes Inferenz-Training optimierten, bleibt die Trainingsphase durch die Verarbeitung großer, oft redundanter lokaler Datensätze ein Engpass. In der vorliegenden Arbeit wird ein datenorientierter Ansatz vorgestellt, der das Problem durch gezieltes Dataset‑Pruning löst.
Der neue Rahmen erstellt kompakte, hochinformative Trainingsuntergruppen, indem er auf dem Gerät eine leichte Wichtigkeitsbewertung durchführt. Dabei werden durchschnittliche Verluststatistiken aus einer kurzen Warm‑Up‑Phase genutzt, um die Samples zu ranken. Anschließend werden deterministisch nur die wichtigsten Datenpunkte unter einem dynamischen Pruning‑Verhältnis behalten. Der Mechanismus ist modellunabhängig, lokal und erfordert keine Kommunikation zwischen Geräten.
Umfangreiche Experimente an Standard‑Bildklassifikationsbenchmarks zeigen, dass das Framework die Trainingslatenz und den Energieverbrauch nahezu linear in Abhängigkeit vom Pruning‑Verhältnis reduziert, während die Modellgenauigkeit praktisch unverändert bleibt. Diese Ergebnisse unterstreichen, dass Dataset‑Pruning ein entscheidendes, ergänzendes Paradigma für die Nachhaltigkeit und Skalierbarkeit von Edge‑Learning darstellt.