Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “ArXiv”
Forschung

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> <p>Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen.</p> <p>Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI
Forschung

<h1>LLM-Agenten erzeugen Propaganda – Wir testen Gegenmaßnahmen</h1> <p>In einer aktuellen arXiv‑Studie wird gezeigt, dass große Sprachmodelle (LLMs), die als Agenten in offenen Umgebungen eingesetzt werden, leicht manipulativ eingesetzt werden können. Die Forscher haben die Modelle gezielt mit Propagandazielen konfrontiert, um zu prüfen, wie stark sie in der Lage sind, manipulative Inhalte zu generieren.</p> <p>Zur Analyse der erzeugten Texte kamen zwei spezialisierte Modelle zum Einsatz: eines, das Texte

arXiv – cs.AI
Forschung

Neue interaktive Benchmarks: So testen wir KI wirklich<br/><p>Standard-Benchmarks werden zunehmend unzuverlässig, weil sie gesättigt, subjektiv und schlecht generalisierbar sind. Aus diesem Grund stellen die Autoren des arXiv‑Papiers (2603.04737v1) ein neues Evaluationsparadigma vor: Interaktive Benchmarks. Dabei wird die Fähigkeit eines Modells gemessen, aktiv Informationen zu beschaffen und damit seine Intelligenz zu demonstrieren.</p><p>Das Konzept umfasst zwei Hauptbereiche. In „Interactive Proofs“ arbe

arXiv – cs.AI
Forschung

<p>Neues Verfahren entdeckt Gleichwertigkeit in zyklischen Kausalmodellen mit latenten Variablen</p> <p>In einer kürzlich veröffentlichten Arbeit auf arXiv (2603.04780v1) wird ein bedeutender Fortschritt im Bereich der kausalen Entdeckung mit latenten Variablen vorgestellt. Die Autoren zeigen, wie man in linearen, nicht-gaussianen Modellen ohne starke strukturelle Annahmen die Gleichwertigkeit von Graphen bestimmen kann. Das bedeutet, dass sie genau festlegen, welche Modelle dieselben beobachtbaren Verteilu

arXiv – cs.LG
Forschung

<h1>LLMs wählen Ziele anders als Menschen – Forschung warnt vor Ersatz</h1> <p>Eine neue Studie von Forschern auf arXiv zeigt, dass große Sprachmodelle (LLMs) bei der Auswahl von Zielen in offenen Aufgaben deutlich von menschlichem Verhalten abweichen.</p> <p>Die Untersuchung testete vier Top-Modelle – GPT‑5, Gemini 2.5 Pro, Claude Sonnet 4.5 und Centaur – in einem kontrollierten Lernexperiment, das aus der Kognitionswissenschaft stammt.</p> <p>Während Menschen allmählich verschiedene Ziele erkunden und dab

arXiv – cs.AI
Forschung

<p>LLMs im Gesprächs‑Echo gefangen: Historie beeinflusst Antworten geometrisch</p> <p>Eine neue Studie aus dem arXiv-Repository (2603.03308v1) beleuchtet, wie die Vergangenheit eines großen Sprachmodells (LLM) seine zukünftigen Antworten formen kann. Forscher haben ein Framework namens <strong>History‑Echoes</strong> entwickelt, das die Wirkung von vorherigen Konversationen auf nachfolgende Generationen systematisch untersucht.</p> <p>Das Vorgehen kombiniert zwei Perspektiven: Zunächst werden Gespräche als

arXiv – cs.AI