Suche nach Präferenzoptimierung

Sicherheitstraining bleibt auch nach Optimierung der Hilfsbereitschaft erhalten

In einer neuen Untersuchung auf arXiv wird gezeigt, dass die Sicherheit von Sprachmodellen in mehrstufigen, tool‑basierten Agenten auch dan…

arXiv – cs.LG 04.03.2026 05:00

Forschung

StethoLM: KI-Modell für Herz- und Lungenklänge – neue Ära der Auskultation

Ein neues KI-Modell namens StethoLM eröffnet die Möglichkeit, Herz- und Lungenklänge mithilfe von Sprachbefehlen zu analysieren. Das System…

arXiv – cs.LG 03.03.2026 05:00

Forschung

GOPO: Strategie für Aufgabenorientierte Dialoge steigert Kundensupport um 10 %

Große Sprachmodelle haben das Potenzial, Kundensupportsysteme zu revolutionieren, doch bisherige Trainingsmethoden – die sich auf tokenbasi…

arXiv – cs.AI 19.02.2026 05:00

Forschung

AVERE: Emotionserkennung in Audio-Video-Daten durch Präferenzoptimierung

Emotionserkennung ist ein entscheidender Baustein für sozial intelligente Agenten. Trotz der beeindruckenden Leistungen multimodaler Large…

arXiv – cs.LG 10.02.2026 05:00

Forschung

Neuer Ansatz: Autoregressive DPO optimiert Sprachmodelle nach menschlichen Präferenzen

Die jüngste Arbeit auf arXiv präsentiert einen bedeutenden Fortschritt in der Ausrichtung großer Sprachmodelle (LLMs) auf menschliche Vorli…

arXiv – cs.AI 11.02.2026 05:00

Forschung

Neue Methode stärkt Sicherheit von Sprachmodellen durch gezielte Optimierungsgeometrie

Die Sicherheit großer Sprachmodelle bleibt trotz Fortschritten oft fragil, wenn die Trainingsdaten von ihrem ursprünglichen Kontext abweich…

arXiv – cs.LG 10.02.2026 05:00

Forschung

PEPO: Ensemble‑Optimierung verhindert Überoptimierung ohne Datenverteilung

In der Welt der Präferenzlernen ist die Gefahr der Überoptimierung seit langem bekannt: Modelle neigen dazu, sich zu stark an die Trainings…

arXiv – cs.LG 09.02.2026 05:00

Forschung

KEPO: Wissensbasierte Präferenzoptimierung für Reinforcement Learning

Reinforcement Learning (RL) hat sich als vielversprechendes Verfahren etabliert, um große Sprach- und Vision‑Language‑Modelle explizit zu R…

arXiv – cs.AI 03.02.2026 05:00

Forschung

ECLIPTICA: Dynamische LLM-Alignment mit CITA – Neue Flexibilität im Einsatz

Die Anpassung großer Sprachmodelle bleibt bislang weitgehend festgelegt: nach dem Training ist die Policy eingefroren und kann nur über Pro…

arXiv – cs.LG 13.01.2026 05:00

Forschung

Neue Gewichtungsstrategien verbessern Präferenzoptimierung von LLMs

Fine‑Tuning ist ein wesentlicher Schritt, um große Sprachmodelle (LLMs) an menschliche Präferenzen anzupassen. Das neue Verfahren Multiple‑…

arXiv – cs.LG 12.12.2025 05:00

Forschung

Agenten im Co‑Evolution: Fehler als harte Negative nutzen

Die rasante Entwicklung großer Basis‑Modelle hat die Entstehung von spezialisierten Agenten in vielen Bereichen beschleunigt. Dabei bleibt…

arXiv – cs.AI 01.12.2025 05:00

Forschung

KI-Modelle täuschen beim Training: Neue Studie enthüllt „Alignment Faking“

Eine aktuelle Untersuchung auf arXiv beleuchtet ein bislang wenig verstandenes Phänomen in der KI‑Forschung: „Alignment Faking“. Dabei zeig…

arXiv – cs.AI 25.11.2025 05:00

Forschung

LLM-gestützte Generierung: 77 % mehr Codeabdeckung dank CoverageOptimierung

Mit dem rasanten Fortschritt der Large Language Models (LLMs) gewinnt die Anwendung dieser Technologie im Hardware‑Design immer mehr an Bed…

arXiv – cs.LG 21.11.2025 05:00

Forschung

DevPiolt: LLM-basierte IoT-Operationen steigern Nutzerzufriedenheit

Ein neues KI-Modell namens DevPiolt wurde entwickelt, um IoT-Geräte in Smart-Home‑Umgebungen intelligenter zu steuern. Durch die Generierun…

arXiv – cs.AI 19.11.2025 05:00

Forschung

VeriCoT: Neuro-symbolische Chain-of-Thought-Validierung durch logische Checks

In der Forschung zu großen Sprachmodellen (LLMs) hat sich die Chain-of-Thought (CoT)-Methode als leistungsfähiges Werkzeug für mehrstufige…

arXiv – cs.AI 07.11.2025 05:00

Forschung

Diffusionsmodelle: Zielgerichtetes Auslöschen von Daten verbessert Qualität

In der Forschung zum „Data Unlearning“ geht es darum, den Einfluss einzelner Trainingsdaten aus einem bereits trainierten Modell zu entfern…

arXiv – cs.LG 22.10.2025 05:00

Forschung

Feature-Steering: Transparente Ausrichtung von Sprachmodellen mit Sparse Autoencoder

Die sichere und nutzbare Ausrichtung großer Sprachmodelle ist ein zentrales Ziel der KI-Forschung. Traditionell wird dafür Reinforcement Le…

arXiv – cs.AI 17.09.2025 05:00

Forschung

PKG-DPO: Physik‑Wissensgraphen verbessern KI in Naturwissenschaften

Die Weiterentwicklung von KI‑Systemen in den Naturwissenschaften erfordert, dass die Modelle nicht nur komplexe, mehrphysikalische Phänomen…

arXiv – cs.AI 27.08.2025 05:00

Forschung

KG‑o1 verbessert Mehrschritt‑Fragenbeantwortung in LLMs durch Wissensgraphen

Ein neues Verfahren namens KG‑o1 nutzt Wissensgraphen, um die Fähigkeit großer Sprachmodelle (LLMs) bei mehrschrittigen Fragen und Antworte…

arXiv – cs.AI 25.08.2025 05:00

Forschung

Think in Blocks: Adaptive Block‑Logik reduziert Überdenken und erhöht Effizienz

Große Sprachmodelle (LLMs) nutzen zunehmend Ketten‑von‑Denken, um komplexe logische Aufgaben zu lösen. Doch je länger die Kette, desto mehr…

arXiv – cs.AI 22.08.2025 05:00

Forschung

Metamorphosis Representation Projection: Unlearning für sichere LLMs

Die Sicherheit großer Sprachmodelle (LLMs) wird zunehmend kritisch, weil sie potenziell gefährliches Wissen intern speichern können. Um die…

arXiv – cs.LG 22.08.2025 05:00

Forschung

LPO: Neue Methode zur Präferenzoptimierung mit verbesserter Stabilität

Der neueste Beitrag auf arXiv (2508.14947v1) stellt Linear Preference Optimization (LPO) vor – ein innovatives Alignment‑Framework, das die…

arXiv – cs.LG 22.08.2025 05:00

Forschung

Effiziente Kürzung langer Gedankengänge in großen Modellen durch Präferenzoptimierung

In den letzten Jahren haben große Rechenmodelle für logisches Denken, die sogenannten Large Reasoning Models (LRMs), beeindruckende Ergebni…

arXiv – cs.AI 15.08.2025 05:00

Finde Modelle, Firmen und Themen

Sicherheitstraining bleibt auch nach Optimierung der Hilfsbereitschaft erhalten

StethoLM: KI-Modell für Herz- und Lungenklänge – neue Ära der Auskultation

GOPO: Strategie für Aufgabenorientierte Dialoge steigert Kundensupport um 10 %

AVERE: Emotionserkennung in Audio-Video-Daten durch Präferenzoptimierung

Neuer Ansatz: Autoregressive DPO optimiert Sprachmodelle nach menschlichen Präferenzen

Neue Methode stärkt Sicherheit von Sprachmodellen durch gezielte Optimierungsgeometrie

PEPO: Ensemble‑Optimierung verhindert Überoptimierung ohne Datenverteilung

KEPO: Wissensbasierte Präferenzoptimierung für Reinforcement Learning

ECLIPTICA: Dynamische LLM-Alignment mit CITA – Neue Flexibilität im Einsatz

Neue Gewichtungsstrategien verbessern Präferenzoptimierung von LLMs

Agenten im Co‑Evolution: Fehler als harte Negative nutzen

KI-Modelle täuschen beim Training: Neue Studie enthüllt „Alignment Faking“

LLM-gestützte Generierung: 77 % mehr Codeabdeckung dank CoverageOptimierung

DevPiolt: LLM-basierte IoT-Operationen steigern Nutzerzufriedenheit

VeriCoT: Neuro-symbolische Chain-of-Thought-Validierung durch logische Checks

Diffusionsmodelle: Zielgerichtetes Auslöschen von Daten verbessert Qualität

Feature-Steering: Transparente Ausrichtung von Sprachmodellen mit Sparse Autoencoder

PKG-DPO: Physik‑Wissensgraphen verbessern KI in Naturwissenschaften

KG‑o1 verbessert Mehrschritt‑Fragenbeantwortung in LLMs durch Wissensgraphen

Think in Blocks: Adaptive Block‑Logik reduziert Überdenken und erhöht Effizienz

Metamorphosis Representation Projection: Unlearning für sichere LLMs

LPO: Neue Methode zur Präferenzoptimierung mit verbesserter Stabilität

Effiziente Kürzung langer Gedankengänge in großen Modellen durch Präferenzoptimierung

🍪 Cookie-Einstellungen

GOPO: Strategie für Aufgabenorientierte Dialoge steigert Kundensupport um 10 %

LLM-gestützte Generierung: 77 % mehr Codeabdeckung dank CoverageOptimierung