KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “autoregressive Sprachmodelle”

<p>Logit-Abstand liefert neue Grenzen für Modellrepräsentationen</p> <p>In einer kürzlich veröffentlichten Studie auf arXiv wird gezeigt, dass bei einer breiten Klasse von diskriminativen Modellen – zu denen auch autoregressive Sprachmodelle gehören – die internen Repräsentationen zweier Modelle bis auf eine invertierbare lineare Transformation übereinstimmen, wenn sie exakt dieselben bedingten Wahrscheinlichkeiten erzeugen. Die Frage, ob ein ähnliches Ergebnis auch bei annähernd gleichen Verteilungen gilt,

arXiv – cs.LG 18.02.2026 05:00

Neue Methode: GFlowNets erweitern Sprachmodelle auf dynamische Span‑Vokabulare

Standard‑autoregressive Sprachmodelle erzeugen Text tokenweise aus einer festen Wortschatzliste, was zu einem baumartigen Zustandsraum führ…

arXiv – cs.AI 12.02.2026 05:00

<p>LLM generiert CAD STEP-Modelle aus Text – neue Technik verbessert Fertigung</p> <p>Die Erstellung von CAD-Modellen bleibt ein arbeitsintensiver Prozess, der Fachwissen erfordert. Mit dem neuen Ansatz STEP‑LLM können auch Nicht‑Experten ihre Designideen in fertige, maschinenlesbare STEP‑Dateien umsetzen. STEP ist das branchenweit akzeptierte, neutrale Format für den Austausch von Produktdaten, doch seine graph‑strukturierte, verknüpfte Natur stellt herkömmliche autoregressive Sprachmodelle vor große Herau

arXiv – cs.AI 21.01.2026 05:00

Robustheit probabilistischer Modelle gegenüber minderwertigen Daten

Eine neue Studie aus dem arXiv-Repository (ArXiv:2512.11912v1) untersucht systematisch, wie moderne probabilistische Modelle auf verrauscht…

arXiv – cs.AI 16.12.2025 05:00

Pixelbasierte Sprachmodelle stärken Robustheit gegen orthografische Angriffe Autoregressive Sprachmodelle leiden bei orthografischen Angriffen stark unter, wenn Eingabetexte mit Zeichen aus verschiedenen Alphabetsystemen verfälscht werden. Das Problem liegt vor allem an der Out‑of‑Vocabulary‑Hürde, die bei subword‑Tokenisierern und ihren Einbettungen entsteht. Um dieser Schwäche entgegenzuwirken, schlägt die neue Studie einen pixelbasierten generativen Ansatz vor. Dabei werden Wörter als einzelne Bilder

arXiv – cs.AI 01.09.2025 05:00