MalDataGen führt Super‑Metrik ein, die Bewertung synthetischer Daten stabilisiert
Die Bewertung der Qualität synthetischer Daten im Android‑Malware‑Bereich ist seit langem ein Problem. Instabilität und fehlende Standardisierung der vorhandenen Messgrößen erschweren die Vergleichbarkeit von Modellen.
In der neuen Arbeit wird eine „Super‑Metrik“ in das Tool MalDataGen integriert. Sie fasst acht einzelne Kennzahlen aus vier Dimensionen der Daten‑Fidelity zu einem einzigen, gewichteten Score zusammen.
Durch Experimente mit zehn generativen Modellen und fünf ausgewogenen Datensätzen konnte gezeigt werden, dass die Super‑Metrik deutlich stabiler und konsistenter ist als herkömmliche Messgrößen. Zudem korreliert sie stärker mit der tatsächlichen Leistung von Klassifikatoren.
Diese Entwicklung bietet Forschern ein zuverlässigeres Werkzeug, um synthetische Daten zu bewerten und damit die Entwicklung effektiver Malware‑Erkennungssysteme zu beschleunigen.