ES4R: Sprachmodell für empathische Antworten mit Vorhersage von Gefühlen In der Welt der Sprachdialoge ist Empathie weit mehr als nur das Verstehen von Wörtern. Sie erfordert auch die Wahrnehmung von Prosodie, Ton und emotionaler Intensität, um die Gefühle des Gesprächspartners wirklich zu erfassen. Das neue Framework ES4R setzt genau hier an und liefert einen innovativen Ansatz für die Erzeugung empathischer Sprachantworten. arXiv – cs.AI 26.01.2026 05:00
Neuer Hyperbolischer Graph-Transformer revolutioniert heterogene Netzwerke Ein brandneues Modell namens Hyperbolic Heterogeneous Graph Transformer (HypHGT) hat die Forschung zu heterogenen Graphen auf ein neues Level gehoben. Durch die vollständige Nutzung des hyperbolischen Raums kann HypHGT komplexe Strukturen wie Baum- und Hierarchien effizient erfassen. arXiv – cs.LG 14.01.2026 05:00
Kreisförmiges Denken: Modelle geraten in selbstverstärkende Schleifen In einer neuen Studie von Forschern auf arXiv wird ein bislang wenig beachtetes Problem großer Rechenmodelle aufgedeckt: die sogenannte „Circular Reasoning“-Schleife. Dabei geraten Modelle in einen selbstverstärkenden Kreislauf, in dem generierter Text als Grundlage für die eigene Wiederholung dient und so zu unnötigem Rechenaufwand und Ausfall führt. arXiv – cs.AI 12.01.2026 05:00
Task-Aware Multi-Expert: Neue Architektur für lebenslanges Deep Learning Ein neuer Ansatz aus dem Bereich des lebenslangen Deep Learning (LDL) verspricht, neuronale Netzwerke in der Lage zu machen, Aufgaben nacheinander zu erlernen, ohne dabei frühere Kenntnisse zu verlieren. Der Algorithmus Task‑Aware Multi‑Expert (TAME) nutzt die Ähnlichkeit von Aufgaben, um gezielt Experten auszuwählen und Wissen zu übertragen. arXiv – cs.LG 15.12.2025 05:00
Transformers revolutionieren Vorhersage von Protein-Secondary-Strukturen Ein neues arXiv‑Veröffentlichung zeigt, wie Transformer‑Modelle Protein‑Sekundärstrukturen – Alpha‑Helices, Beta‑Sheets und Coils – aus Aminosäuresequenzen vorhersagen können. Durch den Einsatz von Aufmerksamkeitsmechanismen gelingt es dem Modell, sowohl lokale als auch entfernte Wechselwirkungen zwischen Residuen zu erfassen. Zusätzlich wird eine Sliding‑Window‑Datenaugmentation auf dem CB513‑Datensatz angewandt, um die Trainingsmenge zu erweitern. Die Ergebnisse demonstrieren eine starke Generalisierungsfähigkeit über Sequenzen unterschiedlicher Länge hinweg und markieren einen bedeutenden Fortschritt in der strukturellen Biologie. arXiv – cs.AI 10.12.2025 05:00
Neuer Transformer löst Wärmeleitungsprobleme an Chip-Substrat-Grenzen In modernen Halbleitergeräten bestimmt die Wärmeabfuhr von der Chip‑Substrat‑Verbindung den thermischen Betrieb. Dort entsteht bei der Übertragung von Wärme aus einer endlichen Chip‑Schicht in ein semi‑unendliches Substrat mit deutlich höheren thermophysikalischen Eigenschaften ein steiler Temperaturgradient, der die transienten Wärmeantworten stark beeinflusst. arXiv – cs.LG 03.12.2025 05:00
Automatisierte FIM‑Bewertung durch Deep Learning erkennt Bewegungsmuster Ein neues Forschungsprojekt aus dem Bereich der Rehabilitationsmedizin hat einen automatisierten Ansatz zur Schätzung des Functional Independence Measure (FIM) entwickelt. Dabei werden anstelle der üblichen, aufwändigen FIM‑Testhandlungen einfache Bewegungsübungen eingesetzt, die von einem tiefen neuronalen Netzwerk verarbeitet werden. arXiv – cs.LG 17.11.2025 05:00
RF-DETR im Detail: Wie Echtzeit-Transformer die Objekterkennung revolutionieren Der neue Beitrag von Towards Data Science erklärt, wie sich die Architektur von starren Rasterstrukturen zu adaptiven Aufmerksamkeitsmechanismen entwickelt hat. Diese Evolution macht RF-DETR zu einem schnellen, flexiblen und äußerst leistungsfähigen Echtzeit-Detektor. Towards Data Science 31.10.2025 12:30
CrossPT: Mehrere Aufgaben mit Prompt‑Tuning effizient übertragen Ein neues Verfahren namens CrossPT eröffnet die Möglichkeit, große Sprachmodelle gezielt für mehrere Aufgaben gleichzeitig zu optimieren. Dabei wird das klassische Prompt‑Tuning um ein moduläres System erweitert, das Wissen zwischen verwandten Aufgaben teilen kann, ohne die spezifische Leistung einzelner Aufgaben zu beeinträchtigen. arXiv – cs.AI 19.09.2025 05:00
Transformer mit Laplace‑Diffusion verbessert Herzfrequenzvorhersage bei Wearables Ein neues Modell aus dem arXiv‑Repository (ArXiv‑ID 2508.16655v1) kombiniert die Leistungsfähigkeit von Transformer‑Netzwerken mit einer Laplace‑Diffusionstechnik, um die Herzfrequenz von Patienten im Kontext ihrer täglichen Aktivitäten präziser vorherzusagen. Durch die Einbindung von Aktivitätsdaten in den gesamten Lernprozess liefert das System ein deutlich genaueres Bild der Herzfrequenzentwicklung als bisherige Ansätze. arXiv – cs.LG 26.08.2025 05:00