Suche nach Distillation

EEG-Modelle trainieren: Multi-Teacher Distillation nutzt Vision und Zeitreihen

In der Welt der Gehirn‑Signalverarbeitung hat sich das Pre‑Training von EEG‑Foundation‑Modellen bislang stark auf selbstüberwachtes Masked‑…

arXiv – cs.LG 06.03.2026 05:00

Forschung

FedAFD: Multimodales Federated Learning mit adversarial Fusion und Distillation

Ein neues Forschungsprojekt namens FedAFD eröffnet einen vielversprechenden Ansatz für multimodales Federated Learning (MFL). Durch die Kom…

arXiv – cs.LG 06.03.2026 05:00

Forschung

TimeWarp: Web-Agenten gegen veränderte Web‑Designs testen

Die jüngste Veröffentlichung von TimeWarp stellt die Leistungsfähigkeit moderner Web‑Agenten auf die Probe, indem sie die sich ständig wand…

arXiv – cs.AI 06.03.2026 05:00

Forschung

FedEMA‑Distill: EMA‑basierte Knowledge‑Distillation stärkt Federated Learning

Federated Learning (FL) leidet häufig unter heterogenen, nicht‑IID‑Daten und aggressiven Clients, was zu Drift, langsamer Konvergenz und ho…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Neues Benchmark und ProStream: Effiziente Erinnerung für endlose Dialogströme

In realen Gesprächsabläufen fließen Informationen ununterbrochen weiter, sodass die zugrunde liegende Speicher‑Architektur stets innerhalb…

arXiv – cs.AI 06.03.2026 05:00

Forschung

<h1>Harmonische Datensatz‑Distillation revolutioniert Zeitreihenprognosen</h1> <p>Die Vorhersage von Zeitreihen steht heute vor enormen Rechen- und Speicheraufwand, weil reale Datensätze immer größer werden. Dataset‑Distillation (DD) bietet eine Lösung, indem sie einen kompakten Datensatz erzeugt, der das Training genauso gut wie das Original ermöglicht. Traditionelle DD‑Ansätze sind jedoch für Zeitreihen nicht optimiert, leiden unter architektonischem Overfitting und skaliert schlecht.</p> <p>Um diese Prob

arXiv – cs.LG 05.03.2026 05:00

Forschung

Temperaturparameter in Knowledge Distillation beleuchtet – klare Auswahlrichtlinien

In der Wissensdistillation wird ein Temperaturparameter eingesetzt, um die in den Gewichten des Lehrmodells verborgene Beziehungsmatrix für…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Router‑Kalibrierung rettet re‑Training‑freie MoE‑Kompression

Die neueste Studie aus dem arXiv‑Repository zeigt, dass die gängige Praxis, Mixture‑of‑Experts‑Modelle ohne erneutes Training zu komprimier…

arXiv – cs.LG 04.03.2026 05:00

Forschung

<h1>Multi-Agent-Training verbessert Produktforschung im E‑Commerce</h1> <p>Large Language Model (LLM)-basierte Agenten zeigen großes Potenzial für die konversationelle Einkaufsunterstützung, doch bisherige Systeme fehlen oft die nötige Tiefe und Kontextbreite, um komplexe Produktrecherchen durchzuführen. Gleichzeitig liefert das Deep‑Research-Paradigma zwar umfangreiche Informationen für die Websuche, stößt aber bei der Übertragung auf den E‑Commerce-Bereich auf erhebliche Lücken.</p> <p>Mit dem neuen Ansat

arXiv – cs.AI 02.03.2026 05:00

Forschung

Neue Methode distilliert RL-optimierte LLMs effizienter

Reinforcement‑Learning‑Post‑Training hat kürzlich große Fortschritte bei der langen Ketten‑von‑Denken‑Logik von großen Sprachmodellen erzie…

arXiv – cs.LG 27.02.2026 05:00

Praxis

Sakana AI: Doc-to-LoRA & Text-to-LoRA – Hypernetzwerke Kontextinternalisierung

Das japanische Start‑Up Sakana AI hat mit den neuen Hypernetzwerken Doc‑to‑LoRA und Text‑to‑LoRA einen Meilenstein in der Anpassung großer…

MarkTechPost 27.02.2026 17:53

Forschung

Neue Spektrale Analyse von Sprachmodellen mit Random Matrix Theory

Eine neue Arbeit aus dem arXiv-Repository präsentiert einen einheitlichen Ansatz, um die beiden größten Herausforderungen moderner Deep‑Lea…

arXiv – cs.LG 27.02.2026 05:00

Aktuell

Live: Anthropic Distillation & Modelltricks – Lambert & Raschka

In einer mitreißenden Live-Session auf SAIL Live #6 trafen sich die KI-Experten Nathan Lambert und Sebastian Raschka, um die neuesten Entwi…

Latent Space 26.02.2026 20:39

Forschung

SymTorch: Automatisierte symbolische Distillation für Deep Learning

Die neue Bibliothek SymTorch ermöglicht es, komplexe neuronale Netzwerke in leicht verständliche, geschlossene mathematische Ausdrücke zu ü…

arXiv – cs.LG 26.02.2026 05:00

Forschung

AngelSlim: Kompakteres, umfassenderes und effizienteres Toolkit für große Modelle

Das neue Toolkit AngelSlim, entwickelt vom Tencent Hunyuan Team, bietet eine umfassende Lösung zur Kompression großer KI‑Modelle. Durch die…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Selbstdistillation ohne Labels: Konsensgating verbessert Dokumentenloses QA

In einer neuen Studie von Forschern aus dem Bereich der künstlichen Intelligenz wird gezeigt, wie ein Modell ohne externe Labels oder verif…

arXiv – cs.LG 25.02.2026 05:00

Aktuell

Anthropic deckt industrielle Distillation von Claude auf

Anthropic hat kürzlich drei groß angelegte Distillationskampagnen von ausländischen Forschungslabors offengelegt, die darauf abzielen, die…

AI News (TechForge) 24.02.2026 15:56

Forschung

Speicherbasierte Prototypen lernen: Methode zur Erkennung gemischter Emotionen

Emotionen im Alltag sind selten eindeutig – meist erleben Menschen mehrere Gefühlszustände gleichzeitig. Traditionelle Modelle der affektiv…

arXiv – cs.LG 25.02.2026 05:00

Forschung

Distillation: Wie wichtig ist sie für chinesische LLMs? Anthropic hat kürzlich einen Beitrag veröffentlicht, in dem die Anfälligkeit von distillierten Modellen für sogenannte „Distillation Attacks“ beleuchtet wird. In diesem Kontext haben Fachleute aus China ihre Sichtweise dargelegt: Distillation bleibt ein zentraler Prozess, um große Sprachmodelle in kompaktere, ressourcenschonende Varianten zu überführen, die für den Einsatz in mobilen und eingebetteten Systemen geeignet sind. Die Experten betonen, d

Interconnects – Nathan Lambert 24.02.2026 16:06

Forschung

IR$^3$: Kontrastives Inverse Reinforcement Learning gegen Reward‑Hacking

Reinforcement Learning from Human Feedback (RLHF) hat die Ausrichtung großer Sprachmodelle revolutioniert, birgt jedoch das Risiko von Rewa…

arXiv – cs.AI 24.02.2026 05:00

Forschung

LaDa: Federiertes Distillationsframework lernfähigkeitsorientierte Datenverteilung

In der Zusammenarbeit von großen Sprachmodellen (LLMs) und kleineren Modellen (SLMs) ist die Verteilung von Daten entscheidend. Ein bislang…

arXiv – cs.AI 24.02.2026 05:00

Aktuell

Anthropic beschuldigt DeepSeek, Moonshot, MiniMax: >16 Mio. Distillation‑Angriffe

We need to produce the output. The content is already German. So we just output the same content as HTML with tags. No extra metadata. So j…

Latent Space 24.02.2026 04:48

Forschung

<h1>CoT-Distillation: Curriculum Learning mit strukturiertem Maskieren & GRPO</h1> <p>Die Übertragung von Chain‑of‑Thought‑(CoT)‑Logik aus großen Sprachmodellen in kompakte Nachschreibermodelle stellt ein zentrales Problem dar: die ausführlichen Begründungen der Lehrermodelle sind für kleinere Modelle oft zu umfangreich, um sie exakt zu replizieren. Traditionelle Ansätze reduzieren die Logik auf einen einzigen Schritt, wodurch die wertvolle Interpretierbarkeit verloren geht.</p> <p>In der neuen Studie wird

arXiv – cs.AI 23.02.2026 05:00

Forschung

Neue Methode für GFlowNets: Adaptive Exploration steigert Effizienz

Generative Flow Networks (GFlowNets) sind eine flexible Familie von amortisierten Samplern, die diskrete und zusammengesetzte Objekte erzeu…

arXiv – cs.LG 23.02.2026 05:00

Forschung

MobCache: LLM-basierte Mensch-Mobilitätssimulation dank Cache-Framework

In einer kürzlich veröffentlichten Arbeit auf arXiv präsentiert ein Forschungsteam ein neues Framework namens MobCache, das die Simulation…

arXiv – cs.AI 20.02.2026 05:00

Forschung

Texo: Formel-Erkennung mit 20 Mio. Parametern – Echtzeit-Performance

Texo, das neue Modell zur Formel-Erkennung, überzeugt mit nur 20 Millionen Parametern – ein Meilenstein in der Kompaktheit von KI-Systemen…

arXiv – cs.AI 20.02.2026 05:00

Forschung

Doc-to-LoRA: Sofortige Kontextinternalisierung für LLMs

Die neue Methode Doc-to-LoRA (D2L) nutzt ein leichtgewichtiges Hypernetzwerk, das in einer einzigen Vorwärtsausführung lernt, Kontextinform…

arXiv – cs.AI 19.02.2026 05:00

Forschung

B‑DENSE: Mehrschichtige Trajektorienausrichtung verbessert Diffusionsmodelle

Diffusionsmodelle haben die Bildgenerierung revolutioniert, doch ihre sequentielle Sampling‑Logik führt zu hohen Latenzen. Durch die wieder…

arXiv – cs.LG 19.02.2026 05:00

Forschung

On‑Policy‑Distillation: Kürzere Prefixe sparen bis zu 47 × Rechenleistung

In einer neuen Studie von Forschern auf arXiv wird gezeigt, dass die On‑Policy‑Distillation (OPD) – ein Verfahren, bei dem ein Student-Mode…

arXiv – cs.LG 18.02.2026 05:00

Forschung

<p>Forscher haben eine neue Technik entwickelt, um Sprachmodelle vor unerlaubter Distillation zu schützen.</p> <p>Knowledge Distillation ist ein weit verbreitetes Verfahren, bei dem große Sprachmodelle ihr Wissen an kleinere, effizientere Modelle übergeben. Doch wenn diese Technik ohne Genehmigung eingesetzt wird, profitiert man unrechtmäßig von den enormen Entwicklungsaufwendungen und Kosten, die in die Schaffung hochentwickelter Modelle geflossen sind.</p> <p>Die neue Methode nutzt „Trace‑Rewriting“, um d

arXiv – cs.AI 18.02.2026 05:00

Finde Modelle, Firmen und Themen

EEG-Modelle trainieren: Multi-Teacher Distillation nutzt Vision und Zeitreihen

FedAFD: Multimodales Federated Learning mit adversarial Fusion und Distillation

TimeWarp: Web-Agenten gegen veränderte Web‑Designs testen

FedEMA‑Distill: EMA‑basierte Knowledge‑Distillation stärkt Federated Learning

Neues Benchmark und ProStream: Effiziente Erinnerung für endlose Dialogströme

Temperaturparameter in Knowledge Distillation beleuchtet – klare Auswahlrichtlinien

Router‑Kalibrierung rettet re‑Training‑freie MoE‑Kompression

Neue Methode distilliert RL-optimierte LLMs effizienter

Sakana AI: Doc-to-LoRA & Text-to-LoRA – Hypernetzwerke Kontextinternalisierung

Neue Spektrale Analyse von Sprachmodellen mit Random Matrix Theory

Live: Anthropic Distillation & Modelltricks – Lambert & Raschka

SymTorch: Automatisierte symbolische Distillation für Deep Learning

AngelSlim: Kompakteres, umfassenderes und effizienteres Toolkit für große Modelle

Selbstdistillation ohne Labels: Konsensgating verbessert Dokumentenloses QA

Anthropic deckt industrielle Distillation von Claude auf

Speicherbasierte Prototypen lernen: Methode zur Erkennung gemischter Emotionen

IR$^3$: Kontrastives Inverse Reinforcement Learning gegen Reward‑Hacking

LaDa: Federiertes Distillationsframework lernfähigkeitsorientierte Datenverteilung

Anthropic beschuldigt DeepSeek, Moonshot, MiniMax: >16 Mio. Distillation‑Angriffe

Neue Methode für GFlowNets: Adaptive Exploration steigert Effizienz

MobCache: LLM-basierte Mensch-Mobilitätssimulation dank Cache-Framework

Texo: Formel-Erkennung mit 20 Mio. Parametern – Echtzeit-Performance

Doc-to-LoRA: Sofortige Kontextinternalisierung für LLMs

B‑DENSE: Mehrschichtige Trajektorienausrichtung verbessert Diffusionsmodelle

On‑Policy‑Distillation: Kürzere Prefixe sparen bis zu 47 × Rechenleistung

🍪 Cookie-Einstellungen

Texo: Formel-Erkennung mit 20 Mio. Parametern – Echtzeit-Performance

On‑Policy‑Distillation: Kürzere Prefixe sparen bis zu 47 × Rechenleistung