Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Generalisierungsfähigkeit”
Forschung

Full-Waveform-Inversion (FWI) ist ein hochkomplexes, nichtlineares Problem, das versucht, Untergrundgeschwindigkeitskarten aus an der Oberfläche aufgezeichneten seismischen Wellen zu rekonstruieren. Traditionell wurden datengetriebene FWI-Methoden mit kleinen Modellen trainiert, weil verfügbare Datensätze begrenzte Volumen, geologische Vielfalt und räumliche Ausdehnung aufweisen. Diese Beschränkungen führten zu erheblichen Bedenken hinsichtlich Overfitting und einer schlechten Generalisierung auf realistisc

In der vorliegenden Studie wird gezeigt, dass ein Modell, das ausschließlich auf simulierten und relativ einfachen Daten trainiert wurde, e…
arXiv – cs.LG
Forschung

<p>LLMs lernen, Algorithmen auszuführen: Neue Trainingsmethode LLM‑DAL</p> <p>In einer aktuellen Veröffentlichung auf arXiv (2601.07898v1) wird gezeigt, dass große Sprachmodelle (LLMs) trotz ihrer beeindruckenden statistischen Lern- und Generalisierungsfähigkeiten noch Schwierigkeiten haben, Daten vollständig zu internalisieren und eigenständig Algorithmen auszuführen. Diese Einschränkung limitiert ihre Einsatzmöglichkeiten in Bereichen, die präzise algorithmische Abläufe erfordern.</p> <p>Die Autoren unter

arXiv – cs.LG