Suche nach Geschwindigkeit

VSPrefill: Neue Sparse‑Attention für lange Kontexte – 4,95‑fach schneller

Die quadratische Komplexität der Selbst‑Attention‑Phase behindert die Nutzung von Sprachmodellen mit sehr langen Kontexten. Bestehende Spar…

arXiv – cs.LG 06.03.2026 05:00

Forschung

KI löst Problem in der theoretischen Physik – Lösungen für kosmische Stränge

In einem bahnbrechenden Ergebnis hat ein KI-System ein seit Jahren offenes Problem der theoretischen Physik gelöst: Es liefert nun exakte a…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Neue Methode beschleunigt Diffusions‑Sprachmodelle ohne Qualitätsverlust

Ein neues Forschungsprojekt aus dem Bereich der künstlichen Intelligenz hat einen innovativen Ansatz vorgestellt, der die Textgenerierung v…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Neues Lernverfahren optimiert DRAM-Equalizer mit Worst-Case-Garantie

Die Optimierung von Equalizer‑Parametern ist entscheidend für die Signalintegrität in Hochgeschwindigkeits‑Speichersystemen, die bei Multi‑…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Neue Bewertungsmethode deckt versteckte Fehler bei KI-Agenten auf

In hochriskanten Einsatzbereichen werden KI‑Agenten, die auf großen Sprachmodellen (LLMs) basieren, immer häufiger eingesetzt. Bisher messe…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Neuer Algorithmus ATPO: Adaptive Tree Policy Optimierung steigert medizinische Dialoge

Ein neuer Ansatz namens Adaptive Tree Policy Optimization (ATPO) verspricht, die Qualität von medizinischen Dialogen deutlich zu verbessern…

arXiv – cs.LG 04.03.2026 05:00

Forschung

SUN: Effiziente gemeinsame Token‑Vorhersage für Multi‑LLM‑Serving

In der heutigen Landschaft des Multi‑Model‑LLM‑Servings bleibt die Decodierung häufig ein Flaschenhals. Durch modellspezifische Ressourcen…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Transformer-Modell SpeedTransformer verbessert Erkennung von Fortbewegungsmodi

In einer neuen Studie aus dem Bereich GeoAI hat das Forschungsteam SpeedTransformer vorgestellt, ein Transformer‑basiertes Modell, das auss…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Full-Waveform-Inversion (FWI) ist ein hochkomplexes, nichtlineares Problem, das versucht, Untergrundgeschwindigkeitskarten aus an der Oberfläche aufgezeichneten seismischen Wellen zu rekonstruieren. Traditionell wurden datengetriebene FWI-Methoden mit kleinen Modellen trainiert, weil verfügbare Datensätze begrenzte Volumen, geologische Vielfalt und räumliche Ausdehnung aufweisen. Diese Beschränkungen führten zu erheblichen Bedenken hinsichtlich Overfitting und einer schlechten Generalisierung auf realistisc

In der vorliegenden Studie wird gezeigt, dass ein Modell, das ausschließlich auf simulierten und relativ einfachen Daten trainiert wurde, e…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Flowette: Flow Matching mit Graphette‑Prioren revolutioniert Graphgenerierung

Flowette ist ein neues, kontinuierliches Flow‑Matching‑Framework, das Graphen mit wiederkehrenden Motiven modelliert. Durch den Einsatz ein…

arXiv – cs.LG 02.03.2026 05:00

Forschung

Ultra-Lange Dokumente schneller und genauer Chunking mit Qwen3-0.6B

In einer wegweisenden Veröffentlichung präsentiert ein Forschungsteam ein neues diskriminatives Segmentierungsmodell, das ultra-lange Texte…

arXiv – cs.AI 02.03.2026 05:00

Forschung

Neue LK-Verluste steigern Akzeptanzrate bei spekulativem Decoding von LLMs

Spekulatives Decoding beschleunigt die Inferenz von autoregressiven Sprachmodellen, indem ein leichtes Draft-Modell zunächst Kandidatentoke…

arXiv – cs.LG 02.03.2026 05:00

Forschung

Neues Prinzip: Schnellere Trainingszeit zeigt wahre Kausalrichtung

Wissenschaftler haben ein neues Konzept namens Causal Computational Asymmetry (CCA) vorgestellt, das die wahre Kausalrichtung zwischen zwei…

arXiv – cs.LG 27.02.2026 05:00

Forschung

SGD vs. Quasi-Newton: Optimierer bestimmen Generalisierbarkeit von Netzen

Neuer Artikel auf arXiv zeigt, wie die Wahl des Optimierers die Qualität von neuronalen Netzen beeinflusst. Forscher untersuchten die beide…

arXiv – cs.LG 26.02.2026 05:00

Forschung

KI verändert Unternehmensgrenzen: Das neue „Headless Firm“ Modell

Die Grenzen eines Unternehmens werden traditionell durch die Kosten der Koordination bestimmt. In der aktuellen Forschung wird gezeigt, das…

arXiv – cs.AI 26.02.2026 05:00

Forschung

NGDB-Zoo: Effizientes, skalierbares Training neuronaler Graphdatenbanken

Neurale Graphdatenbanken (NGDBs) ermöglichen komplexe logische Schlussfolgerungen über unvollständige Wissensstrukturen, stoßen jedoch bei…

arXiv – cs.LG 26.02.2026 05:00

Forschung

Hidden-State‑Speculation: Mehr Leistung durch Wiederverwendung von Draft‑Tokens

Forscher haben eine neue Technik entwickelt, die die Effizienz von Sprachmodellen drastisch steigert. Durch die Nutzung von „Hidden States“…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Mamba beschleunigt Flexible Job Shop Scheduling: Effizientes Sequenzmodell

Ein neues arXiv-Preprint (2602.21546v1) präsentiert eine bahnbrechende Architektur, die das Flexible Job Shop Scheduling (FJSP) mithilfe de…

arXiv – cs.LG 26.02.2026 05:00

Forschung

Neuer Algorithmus beschleunigt Clebsch‑Gordan Tensorprodukte auf asymptotische Ebene

In der Welt der 3D‑Modellierung haben sich E(3)-equivariant neuronale Netzwerke als äußerst leistungsfähig erwiesen. Ein zentrales Element…

arXiv – cs.LG 26.02.2026 05:00

Forschung

HELP: HyperNode-Erweiterung erhöht Genauigkeit und Effizienz von GraphRAG

Moderne Sprachmodelle stoßen häufig an ihre Grenzen, wenn es um das Abrufen von Fakten geht. Sie neigen zu Halluzinationen und können kompl…

arXiv – cs.AI 25.02.2026 05:00

Praxis

In einer Nacht entwickelt: Neue macOS-App für LLM-Präsentation

Am vergangenen Wochenende hielt ich einen Vortrag beim Social Science FOO Camp in Mountain View. Das Event folgte dem klassischen Unconfere…

Simon Willison – Blog 25.02.2026 16:46

Forschung

Momentum Guidance: Neue, effiziente Steuerung für Flow-Modelle

Flow-basierte Generative Modelle haben sich als leistungsstarkes Werkzeug für hochqualitative Bildgenerierung etabliert. In ihrer Standardf…

arXiv – cs.LG 25.02.2026 05:00

Forschung

Neuer Ansatz: Long-Short Flow-Map Perspektive für Driftmodelle

Ein kürzlich veröffentlichtes arXiv‑Paper präsentiert einen frischen Blick auf das sogenannte Drifting Model. Durch eine semigroup‑konsiste…

arXiv – cs.LG 25.02.2026 05:00

Forschung

Neue Methode für robustes Online-Lernen mit Wasserstein-Distributionen

In einer kürzlich veröffentlichten Arbeit auf arXiv präsentieren Forscher einen innovativen Ansatz für das robuste Online-Lernen, bei dem e…

arXiv – cs.LG 25.02.2026 05:00

Forschung

ProxMO: Neue Methode für effizientes Training von LLM-Agenten

In modernen Produktionssystemen, von Kundenservice-Automatisierung bis hin zu interaktiven Einkaufsassistenten, gewinnen mehrstufige LLM‑Ag…

arXiv – cs.AI 24.02.2026 05:00

Forschung