KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “heterogene Agenten”

Neues Modell zeigt, wie Abstinenz KI-Entscheidungen verbessert

In einer aktuellen Studie auf arXiv wird untersucht, wie heterogene Agenten ihre eigene Zuverlässigkeit schätzen und gezielt abstimmen oder…

arXiv – cs.AI 27.02.2026 05:00

ACP: Einheitliches Protokoll für sichere Agentenkommunikation

In der KI‑Forschung geht die Entwicklung von großen Sprachmodellen zunehmend in Richtung autonomer Agenten, die komplexe Entscheidungen tre…

arXiv – cs.AI 18.02.2026 05:00

N-Way Self-Evaluating Deliberation: Neue Architektur vereint heterogene Agenten

Das N-Way Self-Evaluating Deliberation (NSED) ist ein neues Runtime Mixture-of-Models (MoM)-Protokoll, das aus einer Vielzahl unterschiedli…

arXiv – cs.AI 26.01.2026 05:00

PARSE: Neuer Ansatz für dezentrale multimodale Federated Learning ohne Server

In der Welt des dezentralen Federated Learning (DFL) stellen heterogene Agenten, die unterschiedliche Modalitäten und Modelle besitzen, ein…

arXiv – cs.LG 16.01.2026 05:00

Craftax-MA: Neuer Benchmark für Multi-Agent Reinforcement Learning im Hypermaß

In der Forschung zu Multi-Agent Reinforcement Learning (MARL) fehlt bislang ein Benchmark, der die langfristigen Abhängigkeiten und General…

arXiv – cs.LG 10.11.2025 05:00

<h1>Heterogene Agenten: Trust-Region-Optimierung steigert MARL um 22,5 %</h1> <p>Multi-Agent Reinforcement Learning (MARL) erfordert koordinierte und stabile Policy‑Updates zwischen den Agenten. Die bisherige Methode, die Heterogeneous-Agent Trust Region Policy Optimization (HATRPO) genannt wird, nutzt die Kullback‑Leibler‑Divergenz (KL) als Trust‑Region‑Grenze, um das Training zu stabilisieren. Wenn allen Agenten jedoch dieselbe KL‑Schwelle zugewiesen wird, kann das zu langsamen, lokal optimalen Updates fü

arXiv – cs.AI 15.08.2025 05:00