Neues Bewertungsmodell für Phishing-Erkennung mit KI
Phishing‑E-Mails stellen weiterhin eine ernsthafte Bedrohung für die Online-Kommunikation dar, indem sie menschliches Vertrauen ausnutzen und sich an automatisierte Filter anpassen. Obwohl große Sprachmodelle wie GPT‑4…
- Phishing‑E-Mails stellen weiterhin eine ernsthafte Bedrohung für die Online-Kommunikation dar, indem sie menschliches Vertrauen ausnutzen und sich an automatisierte Filt…
- Obwohl große Sprachmodelle wie GPT‑4 und LLaMA‑3‑8B in der Textklassifikation hervorragende Ergebnisse liefern, ist ihre Zuverlässigkeit für den Einsatz in Sicherheitsan…
- Um diesem Bedarf gerecht zu werden, präsentiert die aktuelle Studie das Trustworthiness Calibration Framework (TCF).
Phishing‑E-Mails stellen weiterhin eine ernsthafte Bedrohung für die Online-Kommunikation dar, indem sie menschliches Vertrauen ausnutzen und sich an automatisierte Filter anpassen. Obwohl große Sprachmodelle wie GPT‑4 und LLaMA‑3‑8B in der Textklassifikation hervorragende Ergebnisse liefern, ist ihre Zuverlässigkeit für den Einsatz in Sicherheitsanwendungen noch nicht ausreichend bewertet.
Um diesem Bedarf gerecht zu werden, präsentiert die aktuelle Studie das Trustworthiness Calibration Framework (TCF). Das Framework bewertet Phishing‑Detektoren anhand von drei Kerndimensionen: Kalibrierung, Konsistenz und Robustheit. Diese Aspekte werden in einem zusammengefassten Trustworthiness Calibration Index (TCI) zusammengeführt und durch die Cross‑Dataset Stability (CDS) ergänzt, die die Stabilität der Vertrauenswürdigkeit über verschiedene Datensätze hinweg misst.
In umfangreichen Experimenten mit fünf unterschiedlichen Korpora – darunter SecureMail 2025, Phishing Validation 2024, CSDMC2010, Enron‑Spam und Nazario – wurden Modelle wie DeBERTa‑v3‑base, LLaMA‑3‑8B und GPT‑4 getestet. Die Ergebnisse zeigen, dass GPT‑4 die höchste Gesamtvertrauenswürdigkeit aufweist, gefolgt von LLaMA‑3‑8B und DeBERTa‑v3‑base. Statistische Analysen verdeutlichen, dass die Zuverlässigkeit unabhängig von der reinen Genauigkeit variiert, was die Notwendigkeit einer vertrauensorientierten Bewertung unterstreicht.
Das vorgestellte Framework bietet damit eine transparente und reproduzierbare Basis, um die Abhängigkeit von LLM‑basierten Phishing‑Erkennungssystemen realistisch einzuschätzen und ihre Einsatzfähigkeit in der Praxis zu sichern.
Welche Linse du auf diese Meldung legen solltest
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.
Kontext ohne Glossar-Suche
Wenn du nach dieser Meldung weiterlernen willst
Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.
Dieses Thema taucht in denselben KI-Entwicklungen regelmaessig mit auf und hilft beim groesseren Bild.