Suche nach PRA | meineki.news

LeCun kritisiert AGI: Neue Definition von Superhuman Adaptable Intelligence

Der renommierte KI-Forscher Yann LeCun hat in einem brandneuen Papier die aktuelle Definition von Artificial General Intelligence (AGI) in…

MarkTechPost 08.03.2026 03:57

Praxis

Google präsentiert Android Bench – neues LLM-Benchmark für Android

Google hat Android Bench veröffentlicht, ein neues Leaderboard und Evaluationsframework, das speziell darauf abzielt, die Leistung von Larg…

MarkTechPost 06.03.2026 19:53

Forschung

S5‑SHB‑Agent: Multi‑Modell‑Blockchain‑Framework für Smart Homes

Die Vision von Society 5.0 sieht Smart Homes als zentrale Bausteine einer menschenzentrierten Gesellschaft vor. Mit dem raschen Ausbau hete…

arXiv – cs.AI 06.03.2026 05:00

Forschung

<p>DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 %</p> <p>In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar.</p> <p>Der D

arXiv – cs.AI 06.03.2026 05:00

Forschung

VISA: Präzise Werteanpassung von LLMs ohne Qualitätsverlust

Ein neues Verfahren namens VISA (Value Injection via Shielded Adaptation) verspricht, Large Language Models (LLMs) genauer an menschliche W…

arXiv – cs.AI 06.03.2026 05:00

Praxis

Microsoft präsentiert Phi-4-Reasoning-Vision-15B: Kompaktes Modell für Mathematik

Microsoft hat heute das neue multimodale Modell Phi‑4‑Reasoning‑Vision‑15B vorgestellt. Das 15‑Billionen‑Parameter‑System arbeitet mit offe…

MarkTechPost 06.03.2026 23:53

Forschung

Persistente KV-Cache: Multi-Agent-LLM auf Edge-Geräten effizienter

Multi-Agent-LLM-Systeme, die auf Edge-Geräten laufen, stoßen häufig an die Grenzen des verfügbaren RAMs. Auf einem Apple M4 Pro mit einem C…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

In einer bahnbrechenden Untersuchung wurden vier vorregistrierte Studien mit insgesamt 1 584 Multi-Agent-Simulationen durchgeführt, die 16…

arXiv – cs.AI 06.03.2026 05:00

Forschung

EchoGuard: KI-Framework erkennt manipulative Kommunikation dank Wissensgraph

Manipulative Kommunikation – von Gaslighting über Schuldzuweisungen bis hin zu emotionaler Zwangsausübung – bleibt für viele Menschen schw…

arXiv – cs.AI 06.03.2026 05:00

Forschung

MOOSEnger: KI-Agent für MOOSE-Umgebung beschleunigt Simulationen

Der neue KI-Agent MOOSEnger richtet sich speziell an Anwender des Multiphysics Object‑Oriented Simulation Environment (MOOSE). Durch einen…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Neuste Fortschritte im Zero-Shot-Kommonsense-Reasoning haben vortrainierte Sprachmodelle (PLMs) dazu befähigt, umfangreiches Allgemeinwisse…

arXiv – cs.AI 06.03.2026 05:00

Forschung

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

Ein neues arXiv-Papier (2603.04741v1) präsentiert CONE, ein hybrides Transformer‑Encoder-Modell, das speziell dafür entwickelt wurde, numer…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Neuro-Symbolische Finanzlogik: Zero-Halluzination mit deterministischen Ledgern

Standard Retrieval‑Augmented Generation (RAG) Modelle stoßen in hochriskanten Finanzanwendungen an ihre Grenzen. Sie können weder präzise a…

arXiv – cs.LG 06.03.2026 05:00

Forschung

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Neues Forschungspapier aus dem arXiv-Repository zeigt, dass große Sprachmodelle (LLMs) zwar bei vollständigen Informationen in einem einzig…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

In einer neuen Studie wird die bisherige Symmetrie im Transformer‑Attention‑Mechanismus in Frage gestellt. Während klassische Modelle diese…

arXiv – cs.LG 06.03.2026 05:00

Forschung

WebFactory: Automatisierte Kompression von Sprachmodellwissen zu Web-Agenten

Die Entwicklung von GUI-Agenten steht bislang vor zwei großen Hindernissen: Entweder greifen sie auf unsichere, nicht reproduzierbare Live-…

arXiv – cs.AI 06.03.2026 05:00

Forschung

AegisUI erkennt Verhaltensanomalien in UI-Protokollen von KI-Agenten

KI‑Agenten, die in Echtzeit Benutzeroberflächen aus strukturierten Protokolldaten zusammenbauen, werden immer häufiger in Produktionssystem…

arXiv – cs.AI 06.03.2026 05:00

Forschung

KI‑Monitore lassen sich selbst zu leicht verurteilen – Selbstzuweisungsbias erklärt

Agentische Systeme nutzen zunehmend Sprachmodelle, um ihr eigenes Verhalten zu überwachen. Dabei prüfen Coding‑Agenten beispielsweise den v…

arXiv – cs.AI 06.03.2026 05:00

Forschung

VSPrefill: Neue Sparse‑Attention für lange Kontexte – 4,95‑fach schneller

Die quadratische Komplexität der Selbst‑Attention‑Phase behindert die Nutzung von Sprachmodellen mit sehr langen Kontexten. Bestehende Spar…

arXiv – cs.LG 06.03.2026 05:00

Forschung

K-Gen: Sprachmodell für interpretierbare Trajektorien in autonomen Fahrsimulation

In der autonomen Fahrsimulation steht die Erzeugung realistischer und vielfältiger Fahrtrajektorien im Fokus. K-Gen, ein multimodales Sprac…

arXiv – cs.AI 06.03.2026 05:00

Forschung

PDE-Foundation-Model beschleunigt Parameterbestimmung in ICF

In der Forschung zu Inertial Confinement Fusion (ICF) setzen Wissenschaftler zunehmend auf sogenannte PDE‑Foundation‑Modelle. Diese Modelle…

arXiv – cs.LG 06.03.2026 05:00

Forschung

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> <p>Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen.</p> <p>Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI 06.03.2026 05:00

Forschung

ZorBA: Federiertes Feintuning von LLMs ohne Gradienten – VRAM und Kommunikation optimiert

In der Welt der großen Sprachmodelle (LLMs) eröffnet federiertes Feintuning die Möglichkeit, Modelle über verteilte Clients hinweg gemeinsa…

arXiv – cs.LG 06.03.2026 05:00

Praxis

OpenAI startet Codex Security: KI-gestützte Sicherheitsprüfung in der Vorschau

OpenAI hat Codex Security vorgestellt, einen KI‑gestützten Sicherheitsagenten, der komplette Codebasen analysiert, wahrscheinliche Schwachs…

MarkTechPost 06.03.2026 20:49

Forschung

EVMbench: KI-Agenten testen Smart‑Contract‑Sicherheit

Ein neues arXiv‑Veröffentlichung (2603.04915v1) präsentiert EVMbench, ein umfassendes Testsystem, das die Fähigkeiten von KI-Agenten bei de…

arXiv – cs.LG 06.03.2026 05:00

Forschung

KindSleep: KI-gestützte Diagnose von obstruktiver Schlafapnoe aus Oximetrie

Schlafapnoe betrifft weltweit fast ein Milliarden Menschen und erhöht das Risiko für Herz-Kreislauf-Erkrankungen erheblich. Die klassische…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

Mathematisches Denken in großen Sprachmodellen erfordert bislang riesige Datensätze, doch die Effizienz der Datenverwendung bleibt ein ents…

arXiv – cs.AI 06.03.2026 05:00

Forschung

EvoTool: Selbstoptimierung von Tool‑Nutzungsstrategien in LLM-Agenten

LLM‑basierte Agenten brauchen effektive Tool‑Nutzungsstrategien, um komplexe Aufgaben zu lösen. Die Optimierung dieser Strategien ist jedoc…

arXiv – cs.AI 06.03.2026 05:00

Forschung

BandPO: Dynamische Grenzen für stabile LLM‑Reinforcement‑Learning‑Optimierung

In der Welt der großen Sprachmodelle (LLMs) ist die Stabilität beim Reinforcement Learning entscheidend. Traditionell sorgt das Clipping‑Ve…

arXiv – cs.LG 06.03.2026 05:00

Forschung

MedCoRAG: Durchsichtige Leberdiagnose mit kollaborativem Retrieval und Konsens

Die präzise und nachvollziehbare Diagnose von Lebererkrankungen ist von entscheidender Bedeutung, stellt jedoch in der Praxis weiterhin ein…

arXiv – cs.AI 06.03.2026 05:00

Finde Modelle, Firmen und Themen

LeCun kritisiert AGI: Neue Definition von Superhuman Adaptable Intelligence

Google präsentiert Android Bench – neues LLM-Benchmark für Android

S5‑SHB‑Agent: Multi‑Modell‑Blockchain‑Framework für Smart Homes

VISA: Präzise Werteanpassung von LLMs ohne Qualitätsverlust

Microsoft präsentiert Phi-4-Reasoning-Vision-15B: Kompaktes Modell für Mathematik

Persistente KV-Cache: Multi-Agent-LLM auf Edge-Geräten effizienter

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

EchoGuard: KI-Framework erkennt manipulative Kommunikation dank Wissensgraph

MOOSEnger: KI-Agent für MOOSE-Umgebung beschleunigt Simulationen

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

Neuro-Symbolische Finanzlogik: Zero-Halluzination mit deterministischen Ledgern

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

WebFactory: Automatisierte Kompression von Sprachmodellwissen zu Web-Agenten

AegisUI erkennt Verhaltensanomalien in UI-Protokollen von KI-Agenten

KI‑Monitore lassen sich selbst zu leicht verurteilen – Selbstzuweisungsbias erklärt

VSPrefill: Neue Sparse‑Attention für lange Kontexte – 4,95‑fach schneller

K-Gen: Sprachmodell für interpretierbare Trajektorien in autonomen Fahrsimulation

PDE-Foundation-Model beschleunigt Parameterbestimmung in ICF

ZorBA: Federiertes Feintuning von LLMs ohne Gradienten – VRAM und Kommunikation optimiert

OpenAI startet Codex Security: KI-gestützte Sicherheitsprüfung in der Vorschau

EVMbench: KI-Agenten testen Smart‑Contract‑Sicherheit

KindSleep: KI-gestützte Diagnose von obstruktiver Schlafapnoe aus Oximetrie

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

EvoTool: Selbstoptimierung von Tool‑Nutzungsstrategien in LLM-Agenten

BandPO: Dynamische Grenzen für stabile LLM‑Reinforcement‑Learning‑Optimierung

MedCoRAG: Durchsichtige Leberdiagnose mit kollaborativem Retrieval und Konsens

🍪 Cookie-Einstellungen