Suche nach Generalisierungsfähigkeit

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Neuste Fortschritte im Zero-Shot-Kommonsense-Reasoning haben vortrainierte Sprachmodelle (PLMs) dazu befähigt, umfangreiches Allgemeinwisse…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Malignant Tail: Warum Überparameterisierte Netze bei Label‑Noise versagen

Eine brandneue Veröffentlichung auf arXiv beleuchtet, warum moderne neuronale Netze bei steigender Rauschanteil plötzlich von gutem zu schä…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Full-Waveform-Inversion (FWI) ist ein hochkomplexes, nichtlineares Problem, das versucht, Untergrundgeschwindigkeitskarten aus an der Oberfläche aufgezeichneten seismischen Wellen zu rekonstruieren. Traditionell wurden datengetriebene FWI-Methoden mit kleinen Modellen trainiert, weil verfügbare Datensätze begrenzte Volumen, geologische Vielfalt und räumliche Ausdehnung aufweisen. Diese Beschränkungen führten zu erheblichen Bedenken hinsichtlich Overfitting und einer schlechten Generalisierung auf realistisc

In der vorliegenden Studie wird gezeigt, dass ein Modell, das ausschließlich auf simulierten und relativ einfachen Daten trainiert wurde, e…

arXiv – cs.LG 03.03.2026 05:00

Forschung

FactGuard: KI-gestützte Video-Desinformation mit Reinforcement Learning

In einer bahnbrechenden Veröffentlichung auf arXiv präsentiert das Forschungsteam FactGuard, ein neues KI-Framework, das Video‑Desinformati…

arXiv – cs.AI 27.02.2026 05:00

Forschung

FedVG: Gradient-basierte Aggregation verbessert Learning in heterogenen Umgebungen

In einer Zeit, in der Federated Learning (FL) immer mehr an Bedeutung gewinnt, stellt FedVG einen bedeutenden Fortschritt dar. Das neue Fra…

arXiv – cs.AI 26.02.2026 05:00

Forschung

RadioGen3D: 3D-Radio-Karten aus synthetischen Daten mit adversarial Learning

In der Forschung zu 6G‑Netzwerken und Low‑Altitude‑Drohnenkommunikation gewinnt die präzise Erzeugung von Radio‑Karten zunehmend an Bedeutu…

arXiv – cs.LG 24.02.2026 05:00

Forschung

Neues GNN-Modell GLaDiGAtor verbessert Vorhersage von Krankheits‑Gen‑Assoziationen

Die Zuordnung von Genen zu Krankheiten ist ein entscheidender Schritt, um Krankheitsmechanismen zu verstehen und neue Diagnose- sowie Thera…

arXiv – cs.LG 24.02.2026 05:00

Forschung

GANs steigern Finanzprognosen: Transformer‑basierte Datenaugmentation

Forscher haben gezeigt, dass Generative Adversarial Networks (GANs) die Genauigkeit von Finanzprognosen deutlich erhöhen können. Durch die…

arXiv – cs.AI 23.02.2026 05:00

Forschung

Neue Methode stärkt LLMs gegen Angriffe: Distributional Adversarial Training

Die neueste Forschung auf arXiv (2602.15238v1) präsentiert eine vielversprechende Weiterentwicklung im Bereich des adversarialen Trainings…

arXiv – cs.LG 18.02.2026 05:00

Forschung

Neural Operators lernen effizienter dank fundamentaler Physikkenntnisse

In den letzten Jahren hat die wissenschaftliche maschinelle Lernforschung (SciML) Neural Operators (NOs) zu leistungsstarken Ersatzmodellen…

arXiv – cs.LG 18.02.2026 05:00

Forschung

POP: Meta-Optimizer übertrifft klassische Methoden bei komplexen Optimierungen

In der Welt der Optimierung, wo das Finden von Extrema oft von der Feinabstimmung von Lernraten und Momentum abhängt, präsentiert ein neues…

arXiv – cs.LG 18.02.2026 05:00

Forschung

Feature‑Salienz bestimmt XAI‑Erklärungen, nicht Informationsgehalt

Explainable‑AI‑Methoden (XAI) versprechen, die Entscheidungsprozesse von Machine‑Learning‑Modellen transparent zu machen. Dabei geht man hä…

arXiv – cs.LG 11.02.2026 05:00

Forschung

Neues Framework SDE nutzt Spektrale Entwirrung für robustere multimodale Modelle

In der Welt des multimodalen kontrastiven Lernens hat sich ein neues Konzept namens Spectral Disentanglement and Enhancement (SDE) als viel…

arXiv – cs.AI 11.02.2026 05:00

Forschung

ScaleEnv: Von Grund auf skalierbare Umgebungen für generalistische Agenten

Um generalistische Agenten zu trainieren, die sich in vielfältigen Szenarien zurechtfinden, sind interaktive Lernumgebungen unerlässlich. D…

arXiv – cs.AI 09.02.2026 05:00

Forschung

Neues Forschungsprojekt beleuchtet Lipschitz-Kontinuität in neuronalen Netzen

Deep‑Learning‑Modelle haben in den letzten Jahren enorme Fortschritte erzielt, doch die Frage nach ihrer Robustheit gegenüber kleinen Einga…

arXiv – cs.LG 05.02.2026 05:00

Forschung

Neues Framework NSG-MoE trennt Knoten und optimiert multimodale Graphen

Multimodale Graphen gewinnen zunehmend an Bedeutung, weil sie komplexe Strukturen aus unterschiedlichen Modalitäten – etwa Text, Bild und A…

arXiv – cs.LG 03.02.2026 05:00

Forschung

Riemannische Bayessche Inferenz reduziert Memorisation in generativen Modellen

Moderne generative Modelle können beeindruckend realistische Bilder erzeugen, doch die Balance zwischen Auswendiglernen und Generalisierung…

arXiv – cs.LG 03.02.2026 05:00

Forschung

Neuer Ansatz NCSAM verbessert Lernleistung trotz fehlerhafter Labels

Ein neues Verfahren namens Noise‑Compensated Sharpness‑Aware Minimization (NCSAM) verspricht, das Lernen aus verrauschten Labels deutlich z…

arXiv – cs.AI 29.01.2026 05:00

Forschung

FastWhisper: Schnellere und genauere Spracherkennung dank adaptiver Selbstdistillation

In der Welt der automatischen Spracherkennung hat das neue Modell FastWhisper einen bedeutenden Fortschritt erzielt. Durch die Anwendung ei…

arXiv – cs.AI 29.01.2026 05:00

Forschung

CoLLaMo: Neues multimodales Sprachmodell revolutioniert Molekülanalyse

Ein neues großes molekulares Sprachmodell namens CoLLaMo wurde vorgestellt, das die Grenzen bisheriger Modelle sprengt. Durch die Kombinati…

arXiv – cs.AI 21.01.2026 05:00

Forschung

CNNs triumphieren bei Baumkronen‑Segmentierung mit nur 150 Bildern

Die Erkennung von Baumkronen aus Luftaufnahmen ist ein entscheidender Schritt für Umweltüberwachung, Stadtplanung und Ökosystemanalysen. In…

arXiv – cs.AI 19.01.2026 05:00

Forschung

LLM-Fine‑Tuning: Phishing‑Erkennung zeigt Architekturabhängige Generalisierung

In einer neuen Studie wurden die neuesten Sprachmodelle – Llama 3.1 8B, Gemma 2 9B und Mistral – auf die anspruchsvolle Aufgabe der Phishin…

arXiv – cs.AI 16.01.2026 05:00

Forschung

Epoch-weises Double Descent: Wie Deep Learning trotz Rauschen generalisiert

In einer neuen Untersuchung auf arXiv wurde das Phänomen des epoch‑weisen Double Descent in tiefen neuronalen Netzen unter starkem Rauschen…

arXiv – cs.LG 14.01.2026 05:00

Forschung

LLMs lernen, Algorithmen auszuführen: Neue Trainingsmethode LLM‑DAL In einer aktuellen Veröffentlichung auf arXiv (2601.07898v1) wird gezeigt, dass große Sprachmodelle (LLMs) trotz ihrer beeindruckenden statistischen Lern- und Generalisierungsfähigkeiten noch Schwierigkeiten haben, Daten vollständig zu internalisieren und eigenständig Algorithmen auszuführen. Diese Einschränkung limitiert ihre Einsatzmöglichkeiten in Bereichen, die präzise algorithmische Abläufe erfordern. Die Autoren unter

arXiv – cs.LG 14.01.2026 05:00

Forschung

Neuer selbstüberwachter JKO-Operator beschleunigt Wasserstein-Gradientenflüsse

Wissenschaftler haben einen innovativen, selbstüberwachten Ansatz entwickelt, um die Jordan‑Kinderlehrer‑Otto (JKO) Methode für Wasserstein…

arXiv – cs.LG 12.01.2026 05:00

Forschung

ResMAS: Optimierung der Resilienz in LLM-basierten Multi-Agenten-Systemen

Large‑Language‑Model‑basierte Multi‑Agenten‑Systeme (LLM‑MAS) haben in den letzten Jahren beeindruckende Leistungen in komplexen Aufgabenbe…

arXiv – cs.AI 09.01.2026 05:00

Forschung

Neues Modell TMvRKM verbessert Multiview-Klassifikation mit Kernel-Ansatz

In der aufstrebenden Disziplin des Multiview-Lernens, bei dem Modelle aus mehreren Perspektiven lernen, haben sich Support‑Vector‑Machine‑A…

arXiv – cs.LG 19.12.2025 05:00

Forschung

ML-Modelle für Ernteerträge in Deutschland: Generalisierung im Fokus

Eine neue Untersuchung aus dem arXiv-Repository beleuchtet die Leistungsfähigkeit und Erklärbarkeit von maschinellen Lernmodellen, die Ernt…

arXiv – cs.LG 18.12.2025 05:00

Forschung

Textbasierte Anleitung verbessert Geschlechterklassifikation ohne Bias

In einer wegweisenden Studie wird gezeigt, wie Textinformationen aus Bildunterschriften die Fairness von KI‑Modellen zur Geschlechterklassi…

arXiv – cs.AI 15.12.2025 05:00

Forschung

LLM4XCE: Sprachmodelle revolutionieren XL-MIMO-Kanalabschätzung für 6G

Die nächste Generation der Mobilfunknetze – 6G – setzt auf extrem großflächige Massive-MIMO-Systeme (XL-MIMO), die enorme räumliche Freihei…

arXiv – cs.AI 11.12.2025 05:00

Finde Modelle, Firmen und Themen

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Malignant Tail: Warum Überparameterisierte Netze bei Label‑Noise versagen

FactGuard: KI-gestützte Video-Desinformation mit Reinforcement Learning

FedVG: Gradient-basierte Aggregation verbessert Learning in heterogenen Umgebungen

RadioGen3D: 3D-Radio-Karten aus synthetischen Daten mit adversarial Learning

Neues GNN-Modell GLaDiGAtor verbessert Vorhersage von Krankheits‑Gen‑Assoziationen

GANs steigern Finanzprognosen: Transformer‑basierte Datenaugmentation

Neue Methode stärkt LLMs gegen Angriffe: Distributional Adversarial Training

Neural Operators lernen effizienter dank fundamentaler Physikkenntnisse

POP: Meta-Optimizer übertrifft klassische Methoden bei komplexen Optimierungen

Feature‑Salienz bestimmt XAI‑Erklärungen, nicht Informationsgehalt

Neues Framework SDE nutzt Spektrale Entwirrung für robustere multimodale Modelle

ScaleEnv: Von Grund auf skalierbare Umgebungen für generalistische Agenten

Neues Forschungsprojekt beleuchtet Lipschitz-Kontinuität in neuronalen Netzen

Neues Framework NSG-MoE trennt Knoten und optimiert multimodale Graphen

Riemannische Bayessche Inferenz reduziert Memorisation in generativen Modellen

Neuer Ansatz NCSAM verbessert Lernleistung trotz fehlerhafter Labels

FastWhisper: Schnellere und genauere Spracherkennung dank adaptiver Selbstdistillation

CoLLaMo: Neues multimodales Sprachmodell revolutioniert Molekülanalyse

CNNs triumphieren bei Baumkronen‑Segmentierung mit nur 150 Bildern

LLM-Fine‑Tuning: Phishing‑Erkennung zeigt Architekturabhängige Generalisierung

Epoch-weises Double Descent: Wie Deep Learning trotz Rauschen generalisiert

Neuer selbstüberwachter JKO-Operator beschleunigt Wasserstein-Gradientenflüsse

ResMAS: Optimierung der Resilienz in LLM-basierten Multi-Agenten-Systemen

Neues Modell TMvRKM verbessert Multiview-Klassifikation mit Kernel-Ansatz

ML-Modelle für Ernteerträge in Deutschland: Generalisierung im Fokus

Textbasierte Anleitung verbessert Geschlechterklassifikation ohne Bias

LLM4XCE: Sprachmodelle revolutionieren XL-MIMO-Kanalabschätzung für 6G

🍪 Cookie-Einstellungen