Suche nach KI-Agenten | meineki.news

AegisUI erkennt Verhaltensanomalien in UI-Protokollen von KI-Agenten

KI‑Agenten, die in Echtzeit Benutzeroberflächen aus strukturierten Protokolldaten zusammenbauen, werden immer häufiger in Produktionssystem…

arXiv – cs.AI 06.03.2026 05:00

Forschung

EVMbench: KI-Agenten testen Smart‑Contract‑Sicherheit

Ein neues arXiv‑Veröffentlichung (2603.04915v1) präsentiert EVMbench, ein umfassendes Testsystem, das die Fähigkeiten von KI-Agenten bei de…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Adaptive Memory Admission Control: Mehr Kontrolle für LLM-Agenten

In der rasanten Entwicklung von KI-Agenten wird die Fähigkeit, langfristige Erinnerungen zu nutzen, immer wichtiger. Doch bislang fehlt es…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Speicher als Ontologie: Verfassungsbasierte Architektur für digitale Bürger

In der aktuellen Forschung zu KI-Agenten wird Speicher fast ausschließlich als technisches Modul betrachtet – ein Problem der Speicherung u…

arXiv – cs.AI 06.03.2026 05:00

Praxis

OpenAI stellt Symphony vor: Open-Source-Framework für autonome KI-Agenten

OpenAI hat das neue Open‑Source-Framework Symphony vorgestellt, das die Koordination autonomer KI‑Coding‑Agenten über strukturierte „Implem…

MarkTechPost 05.03.2026 17:37

Forschung

Mozi: Kontrollierte Autonomie für KI-Agenten in der Wirkstoffforschung

Die neueste Veröffentlichung von Mozi eröffnet einen vielversprechenden Weg, künstliche Intelligenz in der Wirkstoffforschung sicher und zu…

arXiv – cs.AI 05.03.2026 05:00

Forschung

KI-Agenten erstellen Firewall-Regeln aus CTI-Daten – Hypernym‑Hyponym schlägt

In einer Zeit, in der das Web ständig neuen Bedrohungen ausgesetzt ist, wird die Fähigkeit, schnell auf neue Angriffe zu reagieren, immer w…

arXiv – cs.AI 05.03.2026 05:00

Praxis

LangWatch liefert Open-Source-Lösung für Evaluierung von KI-Agenten

Mit dem Übergang von einfachen Chat‑Interfaces zu komplexen, mehrstufigen autonomen Agenten steht die KI‑Industrie vor einem entscheidenden…

MarkTechPost 04.03.2026 18:36

Praxis

EverMem-ähnliches KI-Agenten-OS: Hierarchischer Speicher, FAISS, SQLite & Konsolidierung

In diesem Tutorial zeigen wir, wie man ein persistentes KI-Agenten-OS im Stil von EverMem erstellt. Dabei verbinden wir den kurzfristigen G…

MarkTechPost 04.03.2026 23:50

Forschung

AgentAssay: Kostenreduktion von bis zu 100 % bei Regressionstests von KI-Agenten

Autonome KI‑Agenten werden heute in einem noch nie dagewesenen Ausmaß eingesetzt, doch bislang fehlt eine systematische Methode, um sicherz…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Neue Bewertungsmethode deckt versteckte Fehler bei KI-Agenten auf

In hochriskanten Einsatzbereichen werden KI‑Agenten, die auf großen Sprachmodellen (LLMs) basieren, immer häufiger eingesetzt. Bisher messe…

arXiv – cs.AI 04.03.2026 05:00

Forschung

LiveAgentBench: 104 reale Aufgaben testen KI-Agenten

Mit dem neuen Benchmark LiveAgentBench werden KI-Agenten unter realen Bedingungen geprüft. Die Plattform umfasst 104 Szenarien, die aus öff…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Orchestrierte KI-Agenten revolutionieren wissenschaftliches Mehrschritt‑Denken

Multi‑Agent‑Frameworks mit großen Sprachmodellen versprechen komplexes Mehrschritt‑Denken, doch in wissenschaftlichen und wissensintensiven…

arXiv – cs.AI 04.03.2026 05:00

Aktuell

KI-Agenten setzen auf Bitcoin – neue Finanzarchitektur im Aufbruch

KI-Agenten bevorzugen Bitcoin als digitales Vermögenslager, was Finanzverantwortliche dazu zwingt, ihre Systeme für autonome Maschinen neu…

AI News (TechForge) 04.03.2026 10:52

Forschung

GLEAN: Neue Methode zur zuverlässigen Verifikation von KI-Agenten in der Medizin

In einer Zeit, in der KI‑Agenten zunehmend Entscheidungen mit hohem Risiko treffen – etwa bei klinischen Diagnosen – ist eine robuste Verif…

arXiv – cs.AI 04.03.2026 05:00

Forschung

EvoSkill: Automatisierte Entdeckung von Agentenfähigkeiten steigert KI-Leistung

EvoSkill ist ein selbstlernendes Framework, das Agentenfähigkeiten automatisch entdeckt und verfeinert, indem es Fehleranalysen nutzt. Das…

arXiv – cs.AI 04.03.2026 05:00

Forschung

TraderBench: Wie robust sind KI-Agenten in feindlichen Kapitalmärkten? Die Bewertung von KI-Agenten im Finanzbereich steht vor zwei zentralen Problemen: Statische Benchmarks erfordern teure Expertenannotation und vernachlässigen gleichzeitig die dynamische Entscheidungsfindung, die im echten Handel entscheidend ist. Gleichzeitig führen LLM-basierte Richter zu unkontrollierter Varianz bei domänenspezifischen Aufgaben.Mit TraderBench wird diese Lücke geschlossen. Das neue Benchmark-Framework kom

arXiv – cs.AI 03.03.2026 05:00

Forschung

CollabEval: Mehrere KI-Agenten verbessern die Bewertung von LLMs

Large Language Models (LLMs) haben die Bewertung von KI-generierten Inhalten revolutioniert. Das Konzept „LLM-as-a-Judge“ gewinnt dabei imm…

arXiv – cs.AI 03.03.2026 05:00

Praxis

Alibaba präsentiert OpenSandbox: Einheitliche, sichere API für KI-Agenten

In der heutigen digitalen Landschaft ist die Fähigkeit, sich von der Masse abzuheben, entscheidend für den Erfolg von Unternehmen. Die Erst…

MarkTechPost 03.03.2026 08:32

Forschung

KI-Agenten: Wie gut spiegeln sie die reale Arbeitswelt wider? In einer neuen Studie von arXiv (2603.01203v1) wird untersucht, inwieweit die Entwicklung von KI-Agenten tatsächlich die Vielfalt und den Umfang menschlicher Arbeit abbildet. Die Forscher haben 43 Benchmarks und über 72.000 Aufgaben analysiert und diese mit den 1.016 realen US-Berufen verglichen. Dabei zeigte sich ein deutlicher Mismatch: Die meisten Benchmarks konzentrieren sich stark auf Programmieraufgaben, während die meisten Arbeitspl

arXiv – cs.AI 03.03.2026 05:00

Praxis

NullClaw: Das 678‑KB‑Zig‑Framework für KI-Agenten – 1 MB RAM, 2 ms Bootzeit

NullClaw ist ein neues KI-Agenten-Framework, das komplett in reiner Zig geschrieben wurde. Im Gegensatz zu den meisten heutigen Lösungen, d…

MarkTechPost 02.03.2026 19:12

Aktuell

Warum KI-Agenten in Unternehmen zur ultimativen Insider-Bedrohung werden könnten

Generative KI entwickelt sich rasant von einfachen Chatbots zu vollwertigen, autonomen Akteuren. Diese Agenten können nicht nur eigenständi…

ZDNet – Artificial Intelligence 02.03.2026 19:29

Forschung

Moltbook: KI-Agenten zeigen in 12 Tagen Hierarchie, Aufmerksamkeitssättigung

Der neueste KI-native Social‑Network‑Prototyp Moltbook hat in den ersten zwölf Tagen nach seinem Launch ein bemerkenswertes Verhalten gezei…

arXiv – cs.AI 02.03.2026 05:00

Forschung

Agent Behavioral Contracts: Formale Spezifikation und Laufzeitdurchsetzung

Traditionelle Software setzt auf Verträge – APIs, Typsysteme und Assertions – um korrektes Verhalten zu garantieren. Autonome KI-Agenten hi…

arXiv – cs.AI 27.02.2026 05:00

Forschung

Neues Bewertungsframework für KI-Agenten in AutoML-Pipelines

Agentenbasierte AutoML-Systeme setzen große Sprachmodelle ein, um komplexe, mehrstufige Entscheidungen zu treffen – von der Datenvorverarbe…

arXiv – cs.AI 27.02.2026 05:00

Forschung

KI-Agenten revolutionieren Sozialforschung: Können sie Wissenschaftler ersetzen?In der neuesten Veröffentlichung auf arXiv wird beschrieben, wie KI-Agenten – Systeme, die mehrstufige Denkprozesse mit dauerhaftem Speicher, Tool-Zugriff und fachspezifischen Fähigkeiten ausführen – die Sozialforschung grundlegend verändern. Im Gegensatz zu herkömmlichen Chatbots, die nur auf einzelne Anfragen reagieren, können diese Agenten Dateien lesen, Code ausführen, Datenbanken abfragen, das Web durchsuchen und domänen

arXiv – cs.AI 27.02.2026 05:00

Forschung

KI-Agenten lernen, ihr Fehlverhalten selbst zu melden

In einer bahnbrechenden Studie zeigen Forscher, dass KI-Agenten gezielt darauf trainiert werden können, ihr eigenes Fehlverhalten sichtbar…

arXiv – cs.LG 27.02.2026 05:00

Aktuell

Zerstörte Server & DoS-Angriffe: Folgen von OpenClaw KI-Agenten

In einer Reihe von Experimenten haben Forscher die Interaktion von OpenClaw KI-Agenten untereinander getestet und dabei katastrophale Syste…

ZDNet – Artificial Intelligence 27.02.2026 15:16

Forschung

SideQuest: KV-Cache-Management für langfristige agentische Aufgaben

Ein neues Verfahren namens SideQuest wurde vorgestellt, das die Effizienz von KI-Agenten bei langwierigen Aufgaben deutlich verbessert. Bei…

arXiv – cs.AI 27.02.2026 05:00

Forschung

Neues Benchmark AMA-Bench prüft Langzeitgedächtnis von KI-Agenten

Die Forschung im Bereich der großen Sprachmodelle (LLMs) hat einen wichtigen Meilenstein gesetzt: Mit dem neuen Benchmark AMA-Bench (Agent…

arXiv – cs.AI 27.02.2026 05:00

Finde Modelle, Firmen und Themen

AegisUI erkennt Verhaltensanomalien in UI-Protokollen von KI-Agenten

EVMbench: KI-Agenten testen Smart‑Contract‑Sicherheit

Adaptive Memory Admission Control: Mehr Kontrolle für LLM-Agenten

Speicher als Ontologie: Verfassungsbasierte Architektur für digitale Bürger

OpenAI stellt Symphony vor: Open-Source-Framework für autonome KI-Agenten

Mozi: Kontrollierte Autonomie für KI-Agenten in der Wirkstoffforschung

KI-Agenten erstellen Firewall-Regeln aus CTI-Daten – Hypernym‑Hyponym schlägt

LangWatch liefert Open-Source-Lösung für Evaluierung von KI-Agenten

EverMem-ähnliches KI-Agenten-OS: Hierarchischer Speicher, FAISS, SQLite & Konsolidierung

AgentAssay: Kostenreduktion von bis zu 100 % bei Regressionstests von KI-Agenten

**Neue Bewertungsmethode deckt versteckte Fehler bei KI-Agenten auf**

LiveAgentBench: 104 reale Aufgaben testen KI-Agenten

Orchestrierte KI-Agenten revolutionieren wissenschaftliches Mehrschritt‑Denken

KI-Agenten setzen auf Bitcoin – neue Finanzarchitektur im Aufbruch

GLEAN: Neue Methode zur zuverlässigen Verifikation von KI-Agenten in der Medizin

EvoSkill: Automatisierte Entdeckung von Agentenfähigkeiten steigert KI-Leistung

CollabEval: Mehrere KI-Agenten verbessern die Bewertung von LLMs

Alibaba präsentiert OpenSandbox: Einheitliche, sichere API für KI-Agenten

NullClaw: Das 678‑KB‑Zig‑Framework für KI-Agenten – 1 MB RAM, 2 ms Bootzeit

Warum KI-Agenten in Unternehmen zur ultimativen Insider-Bedrohung werden könnten

Moltbook: KI-Agenten zeigen in 12 Tagen Hierarchie, Aufmerksamkeitssättigung

Agent Behavioral Contracts: Formale Spezifikation und Laufzeitdurchsetzung

Neues Bewertungsframework für KI-Agenten in AutoML-Pipelines

KI-Agenten lernen, ihr Fehlverhalten selbst zu melden

Zerstörte Server & DoS-Angriffe: Folgen von OpenClaw KI-Agenten

SideQuest: KV-Cache-Management für langfristige agentische Aufgaben

Neues Benchmark AMA-Bench prüft Langzeitgedächtnis von KI-Agenten

🍪 Cookie-Einstellungen

AgentAssay: Kostenreduktion von bis zu 100 % bei Regressionstests von KI-Agenten

Neue Bewertungsmethode deckt versteckte Fehler bei KI-Agenten auf

NullClaw: Das 678‑KB‑Zig‑Framework für KI-Agenten – 1 MB RAM, 2 ms Bootzeit