Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Evaluation”
Forschung

<h1>Neues Benchmark M-QUEST bewertet Meme‑Toxizität mit semantischem Ansatz</h1> <p>Internet‑Memes sind ein mächtiges Kommunikationsmittel, doch ihre starke Abhängigkeit von Alltagswissen macht die Erkennung von toxischen Inhalten besonders schwierig. Um diesem Problem zu begegnen, hat ein internationales Forschungsteam ein neues, umfassendes Konzept entwickelt, das die wesentlichen Elemente eines Memes systematisch identifiziert und bewertet.</p> <p>Frühere Studien konzentrierten sich meist auf einzelne As

arXiv – cs.AI
Forschung

Neue interaktive Benchmarks: So testen wir KI wirklich<br/><p>Standard-Benchmarks werden zunehmend unzuverlässig, weil sie gesättigt, subjektiv und schlecht generalisierbar sind. Aus diesem Grund stellen die Autoren des arXiv‑Papiers (2603.04737v1) ein neues Evaluationsparadigma vor: Interaktive Benchmarks. Dabei wird die Fähigkeit eines Modells gemessen, aktiv Informationen zu beschaffen und damit seine Intelligenz zu demonstrieren.</p><p>Das Konzept umfasst zwei Hauptbereiche. In „Interactive Proofs“ arbe

arXiv – cs.AI
Forschung

<h1>Neuer Graph-Transformer-Ansatz priorisiert AD‑Gene präziser</h1> <p>Ein neues multimodales Modell namens NETRA (Node Evaluation through Transformer-based Representation and Attention) verspricht, die Priorisierung von Genen, die mit Alzheimer (AD) in Verbindung stehen, deutlich zu verbessern. Im Gegensatz zu herkömmlichen Netzwerkansätzen, die auf statischen Zentralitätsmaßen beruhen, nutzt NETRA ein auf Attention basierendes Scoring, das die Komplexität biologischer Heterogenität besser erfasst.</p> <p

arXiv – cs.LG