Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “EDIT”
Forschung

<p>LLMs im Stil: Neue, leichte Methode zur präzisen Stilsteuerung</p> <p>Die Steuerung von Stilmerkmalen in großen Sprachmodellen (LLMs) ist seit langem ein schwieriges Problem. Traditionelle Ansätze setzen entweder auf komplexe Prompt-Engineering-Strategien oder auf nachträgliche Ausrichtungsprozesse, die viel Rechenaufwand erfordern. In einer kürzlich veröffentlichten Studie wird ein völlig anderer Ansatz verfolgt: die Analyse der internen Repräsentationen der Modelle.</p> <p>Die Autoren gehen davon aus,

arXiv – cs.AI
Praxis

OpenPlanter: Open‑Source KI‑Agent für Mikro‑Überwachung – Palantir Community?<br/><p>Die Machtverhältnisse im digitalen Zeitalter verschieben sich: Regierungen und große Unternehmen nutzen seit Jahren Daten, um Individuen zu verfolgen. Mit dem Open‑Source-Projekt OpenPlanter wird diese Macht zurück in die Hände der Öffentlichkeit gelegt.</p><p>OpenPlanter wurde von dem Entwickler Shin Megami Boson ins Leben gerufen. Es handelt sich um einen rekursiven KI‑Agenten, der auf Sprachmodellen basiert und speziell

MarkTechPost
Forschung

HiPER: Hierarchisches RL mit expliziter Kreditzuweisung verbessert LLM-Agenten<br/><p>Die neue Methode HiPER löst ein zentrales Problem bei der Nutzung von großen Sprachmodellen (LLMs) als interaktive Agenten: In Aufgaben mit langen Entscheidungsfolgen und spärlichen, verzögerten Belohnungen ist es schwierig, die Verantwortung für einzelne Aktionen korrekt zuzuordnen. Traditionelle Reinforcement‑Learning‑Ansätze behandeln LLMs als flache Richtlinien, die bei jedem Schritt nur eine Aktion wählen. Dadurch mus

arXiv – cs.LG