KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Online‑Anpassung”

<p>Mehrere Biases in Reward-Modellen: Mechanistische Shaping-Technik reduziert Vorurteile</p> <p>In einer aktuellen Studie, veröffentlicht auf arXiv, wird gezeigt, dass Reward Models (RMs), die zur Online‑Anpassung von Sprachmodellen an menschliche Präferenzen eingesetzt werden, weiterhin erhebliche Verzerrungen aufweisen. Trotz fortschrittlicher Ansätze bleiben Probleme wie längsbezogene Verzerrungen, sycophantisches Verhalten und übermäßiges Selbstvertrauen bestehen.</p> <p>Die Untersuchung analysierte fü

arXiv – cs.AI 05.03.2026 05:00

Adaptive ROMs: Neue, nicht‑intrusive Modelle für dynamische Systeme

Forscher haben ein neues Konzept für adaptive, nicht‑intrusive Reduktionsmodelle vorgestellt, die sich online an veränderte Systembedingung…

arXiv – cs.LG 13.02.2026 05:00

Online-Parameter-Schätzung für Crazyflie-Quadcopter mittels EM-Algorithmus

Die Forschung zum Crazyflie-Quadcopter hat einen wichtigen Schritt nach vorn gemacht: Mit einem Expectation‑Maximization‑Algorithmus werden…

arXiv – cs.AI 27.01.2026 05:00

<p>Large Language Models (LLMs) stoßen häufig an die Grenze ihres „Wissens-Cutoffs“, weil ihre festgelegten Parameter keine neuen Informationen direkt aufnehmen können. Traditionell wird dafür Supervised Fine‑Tuning (SFT) eingesetzt, das zwar Fakten aktualisiert, aber selten die Fähigkeit verbessert, diese neuen Daten in Antworten oder Entscheidungen zu nutzen.</p>

Reinforcement Learning (RL) kann hingegen das nötige Denkvermögen vermitteln, ist jedoch wegen des hohen Rechenaufwands kaum für schnelle O…

arXiv – cs.LG 19.01.2026 05:00

LLM-Agenten adaptieren live: Neue Testzeit-Methoden steigern Generalisierung

Die neuesten Erkenntnisse aus der KI‑Forschung zeigen, dass große Sprachmodelle (LLMs), die als Agenten eingesetzt werden, bei der Bewältig…

arXiv – cs.LG 10.11.2025 05:00