Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “cross-modal”
Forschung

<p>Alignment Curse: Text‑Jailbreaks übertragen sich auf Audio in Omni‑Modellen</p> <p>In den letzten Monaten haben end‑to‑end trainierte Omni‑Modelle die multimodale Verständniskapazität deutlich gesteigert. Gleichzeitig hat sich das Sicherheits‑Red‑Teaming von rein textbasierten Angriffen auf audio‑basierte Jailbreaks ausgeweitet. Doch die Brücke zwischen Text‑ und Audio‑Jailbreaks blieb bislang wenig erforscht.</p> <p>Die vorliegende Arbeit untersucht, wie sich Jailbreak‑Methoden von Text auf Audio übertr

arXiv – cs.LG
Forschung

<h1>Cloud-basierter Cross-Modal-Transformer revolutioniert Emotionserkennung in HCI</h1> <p>Emotionserkennung ist ein zentrales Element der nächsten Generation menschlicher Computerinteraktion. Traditionelle Systeme analysieren meist nur ein einziges Modalität – sei es Gesichtsausdruck, Stimmlage oder Textsentiment – was ihre Robustheit und Generalisierbarkeit in realen Umgebungen stark einschränkt.</p> <p>In einer neuen Studie wird ein Cloud‑basierter Cross‑Modal‑Transformer (CMT) vorgestellt, der visuelle

arXiv – cs.AI