Neue Technik verbessert Transformer durch gezielte Informationsweiterleitung In der neuesten Forschung zu Decoder‑Only‑Transformern wird gezeigt, dass die Art und Weise, wie Informationen durch das Modell fließen, entscheidend für die Leistung ist. Durch das causale Masking entstehen nicht nur direkte Aufmerksamkeitspfade zwischen Tokens, sondern auch indirekte Wege, die über Zwischentoken laufen – diese werden als „Runways“ bezeichnet. arXiv – cs.LG 22.01.2026 05:00
Neues Multi-Agent Reinforcement Learning mit Attention verbessert Feature-Transformation Ein neues Forschungsprojekt aus dem Bereich der künstlichen Intelligenz präsentiert einen innovativen Ansatz zur Feature‑Transformation, der die Leistung von Modellen für strukturierte Daten deutlich steigert. Durch die Kombination von heterogenen Multi‑Agent Reinforcement Learning (RL) und Attention‑Mechanismen können wichtige Merkmale und deren Kreuzungen effizienter ausgewählt werden. arXiv – cs.LG 01.12.2025 05:00
GESC-Modell revolutioniert Graph Neural Networks bei heterophilen Strukturen Ein neues Verfahren namens Gauge‑Equivariant Graph Network mit Self‑Interference Cancellation (GESC) verspricht, die Leistung von Graph Neural Networks (GNNs) auf heterophilen Graphen deutlich zu verbessern. Während herkömmliche GNNs bei stark heterophilen Strukturen oft an ihre Grenzen stoßen, nutzt GESC eine interferenzbasierte Aggregation, die selbstreplizierende Signale abschwächt und dadurch die Konsistenz der Phaseninformationen erhöht. arXiv – cs.LG 21.11.2025 05:00
Neues Modell liefert präzise Schneewasserprognosen mit Unsicherheitsabschätzung In schneebasierten Wassersystemen ist die Vorhersage des Schneewasseräquivalents (SWE) entscheidend für die Wasserbewirtschaftung. SWE variiert stark in Raum und Zeit, weil es von Topografie, Wetterbedingungen und anderen Faktoren abhängt. Traditionelle Prognosemethoden nutzen diese räumlich‑zeitlichen Zusammenhänge nicht ausreichend und liefern keine Unsicherheitsangaben, die für Entscheidungsträger wichtig sind. arXiv – cs.LG 13.11.2025 05:00
MARAuder's Map: Echtzeit‑Aktivitätserkennung mit Layout‑basierten Trajektorien In smarten Häusern ist die Erkennung menschlicher Aktivitäten über Ambient‑Sensoren noch immer eine Herausforderung. Die meisten Ansätze arbeiten mit vorab segmentierten Daten und berücksichtigen die physische Raumaufteilung kaum, was die Zuverlässigkeit in kontinuierlichen, realen Einsatzszenarien einschränkt. arXiv – cs.LG 11.11.2025 05:00
SDGF: Statische und dynamische Korrelationen vereint für Zeitreihenprognosen In der multivariaten Zeitreihenprognose sind die Beziehungen zwischen den einzelnen Serien entscheidend, doch sie zeigen oft komplexe, sich verändernde Muster über verschiedene Zeitskalen hinweg. Traditionelle Verfahren können diese mehrschichtigen Abhängigkeiten nur begrenzt erfassen, was die Genauigkeit der Vorhersagen beeinträchtigt. arXiv – cs.LG 24.09.2025 05:00
STPFormer: Neuer Transformer für Verkehrsprognosen mit Mustererkennung Die Vorhersage von Verkehrsflüssen in Raum und Zeit ist ein komplexes Problem, das durch vielfältige zeitliche Muster, dynamische räumliche Strukturen und unterschiedliche Eingabeformate erschwert wird. Transformer‑basierte Modelle bieten zwar ein starkes globales Modellierungsvermögen, stoßen jedoch häufig an ihre Grenzen, wenn es um starre zeitliche Codierung und eine schwache Raum‑Zeit‑Fusion geht. arXiv – cs.AI 20.08.2025 05:00