Suche nach Wissensdistillation

Temperaturparameter in Knowledge Distillation beleuchtet – klare Auswahlrichtlinien

In der Wissensdistillation wird ein Temperaturparameter eingesetzt, um die in den Gewichten des Lehrmodells verborgene Beziehungsmatrix für…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Dispersion Loss reduziert Embedding-Condensation und verbessert kleine Sprachmodelle

Die Weiterentwicklung großer Sprachmodelle (LLMs) führt zu beeindruckenden Leistungen, jedoch steigen die Rechenkosten mit jeder zusätzlich…

arXiv – cs.LG 03.02.2026 05:00

Forschung

Wie Unsicherheit bei der Wissensdistillation übertragen wird

Eine neue Untersuchung von ArXiv beleuchtet, wie Unsicherheit während der Wissensdistillation von einem Lehrer- zu einem Schülermodell weit…

arXiv – cs.LG 28.01.2026 05:00

Forschung

Offline‑Lernmethode steigert Fachkompetenz von LLMs bei begrenzten Ressourcen

Eine neue Technik zur Wissensdistillation, die ausschließlich offline arbeitet, ermöglicht es großen Sprachmodellen, sich in spezialisierte…

arXiv – cs.AI 26.01.2026 05:00

Forschung

<h1>KI-Modell für UAV-Steuerung: Hybrid-Distillation mit Chain-of-Thought</h1> <p>Mit dem rasanten Fortschritt großer Sprachmodelle im Code‑Generierungsbereich steht nun die Herausforderung im Vordergrund, diese Fähigkeiten auf ressourcenbeschränkte Drohnen zu übertragen. Ein neues Verfahren kombiniert gezielte Wissensdistillation, Chain‑of‑Thought‑Guidance und supervised fine‑tuning, um die komplexen Denkprozesse in kompakte Modelle zu verlagern.</p> <p>Im Kern steht ein sorgfältig erstelltes Datenset, das

arXiv – cs.AI 14.01.2026 05:00

Forschung

HINT: Hierarchische Distillation beschleunigt Multi-Agenten-Verstärkungslernen Die Wissensdistillation (KD) gilt als vielversprechende Methode, um Multi-Agenten-Verstärkungslernen (MARL) zu beschleunigen, indem ein zentraler Lehrer dezentralen Agenten Wissen vermittelt. In der Praxis stoßen jedoch drei zentrale Hindernisse an: die Erzeugung leistungsfähiger Lehrstrategien in komplexen Umgebungen, die Notwendigkeit, in Zuständen außerhalb des Trainingsbereichs (OOD) zu agieren, und die Diskrepanz zwischen

arXiv – cs.LG 12.01.2026 05:00

Forschung

FedKDX: Federated Learning mit negativer Wissensdistillation verbessert medizinische KI

It looks like the text you provided is already in German. If you intended to translate it from another language (e.g., English) into German…

arXiv – cs.LG 09.01.2026 05:00

Forschung

MemLoRA: Kleine Modelle mit Speicher-Adapter für On-Device-LLMs

Ein neues Verfahren namens MemLoRA ermöglicht es kleinen Sprachmodellen, auf Geräten ohne Cloud‑Abhängigkeit zu arbeiten. Durch die Integra…

arXiv – cs.LG 05.12.2025 05:00

Forschung

RoboDriveBench: Benchmark für robuste Vision‑Language‑Modelle im autonomen Fahren

In einer Zeit, in der Vision‑Language‑Modelle (VLMs) zunehmend als zentrale Entscheidungsinstanz in autonomen Fahrsystemen eingesetzt werde…

arXiv – cs.AI 02.12.2025 05:00

Forschung

Optimale Reihenfolge von Kompressionstechniken für große Sprachmodelle

Ein neues arXiv‑Veröffentlichung beleuchtet, wie die Reihenfolge von Kompressionstechniken die Leistung von großen Sprachmodellen beeinflus…

arXiv – cs.LG 26.11.2025 05:00

Forschung

ProNECL: EEG-Decoding ohne Vergessen über Personen hinweg

Die enorme Variabilität von EEG-Signalen zwischen Individuen führt dazu, dass beim kontinuierlichen EEG-Decoding Wissen, das aus früheren P…

arXiv – cs.AI 27.11.2025 05:00

Forschung

Leichtgewichtiges Modell für Denken: Dynamisches Pruning & Distillation

Mit dem rasanten Fortschritt im Deep Learning haben große Sprachmodelle beeindruckende Fähigkeiten in komplexen Rechenaufgaben gezeigt. Ihr…

arXiv – cs.LG 25.11.2025 05:00

Forschung

FactGuard: KI-gestützte Fake-News-Erkennung ohne Stilabhängigkeit

Die Erkennung von Falschmeldungen hat sich lange auf stilistische Merkmale konzentriert, doch Angreifer imitieren zunehmend den Schreibstil…

arXiv – cs.AI 14.11.2025 05:00

Finde Modelle, Firmen und Themen

Temperaturparameter in Knowledge Distillation beleuchtet – klare Auswahlrichtlinien

Dispersion Loss reduziert Embedding-Condensation und verbessert kleine Sprachmodelle

Wie Unsicherheit bei der Wissensdistillation übertragen wird

Offline‑Lernmethode steigert Fachkompetenz von LLMs bei begrenzten Ressourcen

FedKDX: Federated Learning mit negativer Wissensdistillation verbessert medizinische KI

MemLoRA: Kleine Modelle mit Speicher-Adapter für On-Device-LLMs

RoboDriveBench: Benchmark für robuste Vision‑Language‑Modelle im autonomen Fahren

Optimale Reihenfolge von Kompressionstechniken für große Sprachmodelle

ProNECL: EEG-Decoding ohne Vergessen über Personen hinweg

Leichtgewichtiges Modell für Denken: Dynamisches Pruning & Distillation

FactGuard: KI-gestützte Fake-News-Erkennung ohne Stilabhängigkeit

🍪 Cookie-Einstellungen