Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Schwierigkeitsgrad”
Forschung

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> <p>Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen.</p> <p>Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI
Forschung

<p>LLMs zeigen versteckte Vorurteile bei Logikrätseln – neues PRIME-Framework enthüllt Bias</p> <p>Ein neues Evaluationssystem namens PRIME (Puzzle Reasoning for Implicit Biases in Model Evaluation) nutzt Logikrätsel, um subtile soziale Vorurteile in großen Sprachmodellen zu entdecken. Durch die automatische Erstellung und Überprüfung von Rätseln in unterschiedlichen Schwierigkeitsgraden kann PRIME gezielt stereotype, antistereotype und neutrale Varianten erzeugen, die auf einer gemeinsamen Struktur basiere

arXiv – cs.AI