Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Verzerrung”
Forschung

<p>Mehrere Biases in Reward-Modellen: Mechanistische Shaping-Technik reduziert Vorurteile</p> <p>In einer aktuellen Studie, veröffentlicht auf arXiv, wird gezeigt, dass Reward Models (RMs), die zur Online‑Anpassung von Sprachmodellen an menschliche Präferenzen eingesetzt werden, weiterhin erhebliche Verzerrungen aufweisen. Trotz fortschrittlicher Ansätze bleiben Probleme wie längsbezogene Verzerrungen, sycophantisches Verhalten und übermäßiges Selbstvertrauen bestehen.</p> <p>Die Untersuchung analysierte fü

arXiv – cs.AI
Forschung

<p>Prior Estimator: Lernende Klassenprioritäten aus latenten Repräsentationen</p> <p>Eine neue Methode namens Neural Prior Estimator (NPE) löst das Problem des Klassenungleichgewichts in tiefen neuronalen Netzen, indem sie die effektiven Klassenprioritäten aus den latenten Merkmalen lernt. Durch die Anpassung der Logits an die geschätzten Prioritäten werden Verzerrungen reduziert und die Leistung bei seltenen Klassen verbessert.</p> <p>NPE kombiniert einen oder mehrere Prior Estimation Modules, die gemeinsa

arXiv – cs.LG
Forschung

<p>LLM-Agenten mit Tool-Integration: Lineare Fehlerentwicklung nach Martingale-Analyse</p> <p>In einer neuen Studie von Forschern auf arXiv wird erstmals ein theoretisches Modell vorgestellt, das die Fehlerentwicklung von KI-Agenten, die externe Tools nutzen, systematisch untersucht. Die Autoren zeigen, dass die kumulative Verzerrung bei solchen Agenten linear mit der Anzahl der Tool-Aufrufe wächst, während die Abweichungen mit hoher Wahrscheinlichkeit im Rahmen von <em>O(√T)</em> bleiben. Dieses Ergebnis s

arXiv – cs.AI