Suche nach EDIT | meineki.news

LLMs im Stil: Neue, leichte Methode zur präzisen Stilsteuerung Die Steuerung von Stilmerkmalen in großen Sprachmodellen (LLMs) ist seit langem ein schwieriges Problem. Traditionelle Ansätze setzen entweder auf komplexe Prompt-Engineering-Strategien oder auf nachträgliche Ausrichtungsprozesse, die viel Rechenaufwand erfordern. In einer kürzlich veröffentlichten Studie wird ein völlig anderer Ansatz verfolgt: die Analyse der internen Repräsentationen der Modelle. Die Autoren gehen davon aus,

arXiv – cs.AI 05.03.2026 05:00

Router‑Kalibrierung rettet re‑Training‑freie MoE‑Kompression

Die neueste Studie aus dem arXiv‑Repository zeigt, dass die gängige Praxis, Mixture‑of‑Experts‑Modelle ohne erneutes Training zu komprimier…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Rooted Prefix Balance & Submodular Replay verbessern GFlowNet-Training

Generative Flow Networks (GFlowNets) ermöglichen es, große Sprachmodelle so zu feintunen, dass sie belohnungsproportionale Posteriorverteil…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Meta‑RL nutzt Symmetrie: Geometrische Methode ermöglicht globale Generalisierung

Meta‑Reinforcement‑Learning (Meta‑RL) generalisiert bislang meist über die Glattheit der Aufgabenkodierung. Diese Strategie erfordert eine…

arXiv – cs.LG 03.03.2026 05:00

Forschung

MemPO: 73 % weniger Token, 26 % mehr F1 bei Langzeit-Agenten

Langzeit-Agenten, die über viele Interaktionsschritte hinweg lernen, kämpfen häufig mit einer stetig wachsenden Kontextgröße. Diese Expansi…

arXiv – cs.AI 03.03.2026 05:00

Forschung

CWM: Kontrastives Weltmodell verbessert Aktionsbewertung in Embodied Agents

In der Forschung zu Embodied Agents steht die zuverlässige Bewertung, welche Aktionen tatsächlich ausgeführt werden können, im Mittelpunkt…

arXiv – cs.AI 27.02.2026 05:00

Forschung

VeRO: Ein Evaluations-Framework zur Optimierung von Agenten

In der KI-Forschung hat das neue Tool VERO einen bedeutenden Fortschritt erzielt: Es bietet ein standardisiertes System, um die Leistungsfä…

arXiv – cs.AI 27.02.2026 05:00

Forschung

SemSIEdit: LLMs korrigieren sensible Infos – Lecks um 34,6 % reduziert

Eine neue Studie aus dem arXiv-Repository zeigt, dass große Sprachmodelle ihre eigenen sensiblen Ausgaben selbstständig korrigieren können…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Neues Verfahren garantiert stabile Mechanismen in neuronalen Netzen

Verstehen, wie neuronale Netzwerke ihre Vorhersagen treffen, ist entscheidend für Debugging, Auditing und den Einsatz in der Praxis. Die me…

arXiv – cs.AI 27.02.2026 05:00

Praxis

In einer Nacht entwickelt: Neue macOS-App für LLM-Präsentation

Am vergangenen Wochenende hielt ich einen Vortrag beim Social Science FOO Camp in Mountain View. Das Event folgte dem klassischen Unconfere…

Simon Willison – Blog 25.02.2026 16:46

Forschung

Goldene Schichten: Schnelleres Wissenseditieren in LLMs via Gradient‑Analyse

Wissensänderungen in großen Sprachmodellen (LLMs) sollen gezielt die Vorhersage für einen bestimmten Suchbegriff anpassen, ohne das Verhalt…

arXiv – cs.LG 25.02.2026 05:00

Forschung

CREDIT: Eigentumsprüfung von DNNs gegen Modell-Extraktion

Im Zeitalter von Machine‑Learning‑as‑a‑Service (MLaaS) greifen Unternehmen und Entwickler auf Deep‑Neural‑Network‑Modelle (DNNs) über stand…

arXiv – cs.LG 25.02.2026 05:00

Forschung

ProxMO: Neue Methode für effizientes Training von LLM-Agenten

In modernen Produktionssystemen, von Kundenservice-Automatisierung bis hin zu interaktiven Einkaufsassistenten, gewinnen mehrstufige LLM‑Ag…

arXiv – cs.AI 24.02.2026 05:00

Forschung

DesignAsCode: Grafikgestaltung – Editierbarkeit & visuelle Qualität

In der Welt der automatisierten Grafikgestaltung steht die Herausforderung im Vordergrund, ein Design zu erzeugen, das sowohl optisch überz…

arXiv – cs.AI 23.02.2026 05:00

Praxis

OpenPlanter: Open‑Source KI‑Agent für Mikro‑Überwachung – Palantir Community? Die Machtverhältnisse im digitalen Zeitalter verschieben sich: Regierungen und große Unternehmen nutzen seit Jahren Daten, um Individuen zu verfolgen. Mit dem Open‑Source-Projekt OpenPlanter wird diese Macht zurück in die Hände der Öffentlichkeit gelegt.OpenPlanter wurde von dem Entwickler Shin Megami Boson ins Leben gerufen. Es handelt sich um einen rekursiven KI‑Agenten, der auf Sprachmodellen basiert und speziell

MarkTechPost 21.02.2026 21:10

Praxis

Praktischer Leitfaden: Bildgenerierung, Steuerung & Bearbeitung mit HuggingFace Diffusers

In diesem Tutorial wird ein praxisnaher Ablauf zur Bildgenerierung mit der Diffusers‑Bibliothek vorgestellt. Zunächst wird die Umgebung sta…

MarkTechPost 21.02.2026 00:55

Forschung

HiPER: Hierarchisches RL mit expliziter Kreditzuweisung verbessert LLM-Agenten Die neue Methode HiPER löst ein zentrales Problem bei der Nutzung von großen Sprachmodellen (LLMs) als interaktive Agenten: In Aufgaben mit langen Entscheidungsfolgen und spärlichen, verzögerten Belohnungen ist es schwierig, die Verantwortung für einzelne Aktionen korrekt zuzuordnen. Traditionelle Reinforcement‑Learning‑Ansätze behandeln LLMs als flache Richtlinien, die bei jedem Schritt nur eine Aktion wählen. Dadurch mus

arXiv – cs.LG 19.02.2026 05:00

Forschung

KI-gestützte Vorhersage von Rechnungsdilution in Lieferkettensfinanzierung

Rechnungsdilution – der Unterschied zwischen dem genehmigten Rechnungsbetrag und dem tatsächlich eingezogenen Betrag – stellt einen bedeute…

arXiv – cs.AI 18.02.2026 05:00

Forschung

CogRouter: Dynamische Tiefenanpassung für LLM-Agenten erhöht Effizienz und Erfolg

Large Language Models (LLMs) werden zunehmend als autonome Agenten eingesetzt, um komplexe Mehrschritt-Entscheidungsaufgaben zu lösen. Dabe…

arXiv – cs.AI 16.02.2026 05:00

Forschung

DECKBench: Neuer Benchmark für Multi-Agenten bei akademischen Folien

Die automatische Erstellung und iterative Bearbeitung von akademischen Präsentationen erfordert weit mehr als reine Textzusammenfassung. Er…

arXiv – cs.AI 17.02.2026 05:00

Forschung

DragDiffusion Reproduziert: Interaktive Bildbearbeitung mit Diffusionsmodellen

DragDiffusion ist ein neuartiges, diffusionbasiertes Verfahren, das es Nutzern ermöglicht, Bilder durch einfaches Ziehen von Punkten zu ver…

arXiv – cs.AI 16.02.2026 05:00

Forschung

Neues Modell korrigiert ASR-Fehler bei Namen mit adaptiver Chain-of-Thought

End-to-End-Spracherkennungssysteme haben oft Probleme, domänenspezifische Begriffe wie Namen korrekt zu erkennen. Ein neues, auf großen Spr…

arXiv – cs.AI 16.02.2026 05:00

Forschung

Neues RL-Verfahren nutzt Sprachmodell-Beliefs für langfristige Interaktion

In einer wegweisenden Veröffentlichung präsentiert ein Forschungsteam ein neues Reinforcement‑Learning‑Verfahren namens ΔBelief‑RL, das die…

arXiv – cs.AI 16.02.2026 05:00

Forschung

Nur 15 % der Tokens sind entscheidend: Technik verbessert multimodale KI-Logik

Mit Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) wurden die Denkfähigkeiten multimodaler Large Language Models (MLLMs) deu…

arXiv – cs.AI 13.02.2026 05:00

Forschung

scPilot: KI-gestützte Analyse von Einzelzellen – neue Wege in der Genomik

Mit scPilot eröffnet ein neues Kapitel in der Analyse von Einzelzell-Genomdaten. Das System nutzt ein großes Sprachmodell, das in natürlich…

arXiv – cs.AI 13.02.2026 05:00

Aktuell

Agentische KI steigert ROI in der Kreditorenbuchhaltung

Finanzleiter setzen agentische KI ein, um die Rendite bei der Automatisierung der Kreditorenbuchhaltung zu steigern. Durch die Umwandlung m…

AI News (TechForge) 13.02.2026 12:33

Forschung

ProtoT: Ein neuer Transformer, der mit Prototypen erklärbar bleibt

Die neueste Veröffentlichung auf arXiv (2602.11852v1) stellt den Prototype Transformer (ProtoT) vor – ein autoregressives Sprachmodell, das…

arXiv – cs.AI 13.02.2026 05:00

Forschung

Visuelle Jailbreak-Angriffe auf Bildbearbeitungsmodelle: Sicherheitslücke entdeckt

Die neuesten Fortschritte in großen Bildbearbeitungsmodellen haben das Paradigma von textbasierten Anweisungen zu vision‑prompt‑Editing ver…

arXiv – cs.AI 12.02.2026 05:00

Forschung

PRISM-XR: Datenschutzfreundliche XR‑Kollaboration mit multimodalen LLMs

In einer wegweisenden Entwicklung für die erweiterte Realität (XR) präsentiert PRISM‑XR ein innovatives Framework, das die Zusammenarbeit v…

arXiv – cs.AI 12.02.2026 05:00

Forschung

Adaptive Meilenstein‑Belohnung verbessert GUI-Agenten um 10 %

Reinforcement Learning (RL) hat sich als Standardverfahren für die Schulung von mobilen GUI‑Agenten etabliert, stößt jedoch bei Aufgaben mi…

arXiv – cs.LG 13.02.2026 05:00

Finde Modelle, Firmen und Themen

Router‑Kalibrierung rettet re‑Training‑freie MoE‑Kompression

Rooted Prefix Balance & Submodular Replay verbessern GFlowNet-Training

Meta‑RL nutzt Symmetrie: Geometrische Methode ermöglicht globale Generalisierung

MemPO: 73 % weniger Token, 26 % mehr F1 bei Langzeit-Agenten

CWM: Kontrastives Weltmodell verbessert Aktionsbewertung in Embodied Agents

VeRO: Ein Evaluations-Framework zur Optimierung von Agenten

SemSIEdit: LLMs korrigieren sensible Infos – Lecks um 34,6 % reduziert

Neues Verfahren garantiert stabile Mechanismen in neuronalen Netzen

In einer Nacht entwickelt: Neue macOS-App für LLM-Präsentation

Goldene Schichten: Schnelleres Wissenseditieren in LLMs via Gradient‑Analyse

CREDIT: Eigentumsprüfung von DNNs gegen Modell-Extraktion

ProxMO: Neue Methode für effizientes Training von LLM-Agenten

DesignAsCode: Grafikgestaltung – Editierbarkeit & visuelle Qualität

Praktischer Leitfaden: Bildgenerierung, Steuerung & Bearbeitung mit HuggingFace Diffusers

KI-gestützte Vorhersage von Rechnungsdilution in Lieferkettensfinanzierung

CogRouter: Dynamische Tiefenanpassung für LLM-Agenten erhöht Effizienz und Erfolg

DECKBench: Neuer Benchmark für Multi-Agenten bei akademischen Folien

DragDiffusion Reproduziert: Interaktive Bildbearbeitung mit Diffusionsmodellen

Neues Modell korrigiert ASR-Fehler bei Namen mit adaptiver Chain-of-Thought

Neues RL-Verfahren nutzt Sprachmodell-Beliefs für langfristige Interaktion

Nur 15 % der Tokens sind entscheidend: Technik verbessert multimodale KI-Logik

scPilot: KI-gestützte Analyse von Einzelzellen – neue Wege in der Genomik

Agentische KI steigert ROI in der Kreditorenbuchhaltung

ProtoT: Ein neuer Transformer, der mit Prototypen erklärbar bleibt

Visuelle Jailbreak-Angriffe auf Bildbearbeitungsmodelle: Sicherheitslücke entdeckt

PRISM-XR: Datenschutzfreundliche XR‑Kollaboration mit multimodalen LLMs

Adaptive Meilenstein‑Belohnung verbessert GUI-Agenten um 10 %

🍪 Cookie-Einstellungen

MemPO: 73 % weniger Token, 26 % mehr F1 bei Langzeit-Agenten

SemSIEdit: LLMs korrigieren sensible Infos – Lecks um 34,6 % reduziert

Nur 15 % der Tokens sind entscheidend: Technik verbessert multimodale KI-Logik

Adaptive Meilenstein‑Belohnung verbessert GUI-Agenten um 10 %