ERF-BA-TFD+ setzt neue Maßstäbe bei Audio-Visual Deepfake-Erkennung
Ein brandneues multimodales Deepfake-Erkennungsmodell namens ERF-BA-TFD+ hat die Messlatte für die Analyse manipulierten Multimedia‑Inhalts in der realen Welt deutlich anheben. Durch die Kombination eines erweiterten Receptive Field (ERF) mit einer Audio‑Visual‑Fusion verarbeitet das System gleichzeitig Ton‑ und Bilddaten und nutzt die komplementären Informationen beider Modalitäten, um die Erkennungsgenauigkeit und Robustheit zu steigern.