Suche nach Wahlen | meineki.news

Neue Methode steigert Genauigkeit strukturierter LLM-Ausgaben um bis zu 24 %

Moderne Sprachmodelle werden zunehmend eingesetzt, um ausführbare Ausgaben wie JSON‑Objekte oder API‑Aufrufe zu erzeugen. Dabei kann ein ei…

arXiv – cs.AI 05.03.2026 05:00

Forschung

<h1>LLMs wählen Ziele anders als Menschen – Forschung warnt vor Ersatz</h1> Eine neue Studie von Forschern auf arXiv zeigt, dass große Sprachmodelle (LLMs) bei der Auswahl von Zielen in offenen Aufgaben deutlich von menschlichem Verhalten abweichen. Die Untersuchung testete vier Top-Modelle – GPT‑5, Gemini 2.5 Pro, Claude Sonnet 4.5 und Centaur – in einem kontrollierten Lernexperiment, das aus der Kognitionswissenschaft stammt. Während Menschen allmählich verschiedene Ziele erkunden und dab

arXiv – cs.AI 05.03.2026 05:00

Forschung

AgentSelect: Benchmark für narrative Agentenempfehlungen

LLM‑Agenten werden zunehmend zum praktischen Interface für die Automatisierung von Aufgaben. Trotz dieser raschen Verbreitung fehlt bislang…

arXiv – cs.AI 05.03.2026 05:00

Forschung

Neue Methode reduziert widersprüchliche Erklärungen in Empfehlungssystemen

In der Welt der KI-basierten Empfehlungssysteme haben Forscher ein neues Problem identifiziert: Erklärungen, die zwar sprachlich flüssig un…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Neurale Operatoren: Zuverlässiger Umgang mit Funktionen außerhalb des Trainings

In einer neuen Veröffentlichung auf arXiv wird ein rigoroses Konzept vorgestellt, das neuronale Operatoren erweitert, um Eingabefunktionen…

arXiv – cs.LG 05.03.2026 05:00

Forschung

Certainty-Validity: Diagnose-Framework für diskrete Commitment-Systeme

Standardmetriken wie Genauigkeit, Präzision, Recall und AUROC gehen davon aus, dass alle Fehler gleich schwerwiegend sind – ein sicher fals…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Neues Framework GUIDE verbessert automatisierte Bewertung von offenen Antworten

Die automatisierte Bewertung von offenen Schülerantworten ist ein entscheidender Schritt, um personalisiertes Feedback in großem Umfang zu…

arXiv – cs.AI 03.03.2026 05:00

Aktuell

Wechsel zu Claude: So übertragen Sie Ihre Erinnerungen und Einstellungen mühelos

Claude AI hat eine neue Funktion eingeführt, mit der Nutzer ihre gespeicherten Erinnerungen und Einstellungen von einer anderen KI einfach…

ZDNet – Artificial Intelligence 02.03.2026 19:59

Forschung

TENG-BC: Neural PDE Solver mit hoher Präzision bei zeitabhängigen Gleichungen

Ein neuer Ansatz namens TENG-BC (Time‑Evolving Natural Gradient for Boundary Conditions) verspricht, die langjährige Herausforderung der ex…

arXiv – cs.LG 03.03.2026 05:00

Forschung

PseudoAct: Pseudocode‑Synthese ermöglicht flexible Planung in LLM‑Agenten

In der Welt der großen Sprachmodelle (LLM) setzen Agenten bislang vorwiegend reaktive Entscheidungsparadigmen wie ReAct ein. Diese wählen A…

arXiv – cs.AI 02.03.2026 05:00

Forschung

FlexMS: Flexibles Benchmark-Framework für Deep‑Learning‑Massenspektrometrie

Ein neuer Beitrag auf arXiv (2602.22822v1) präsentiert FlexMS, ein flexibles Benchmark‑Framework, das die Bewertung von Deep‑Learning‑Model…

arXiv – cs.AI 27.02.2026 05:00

Forschung

LLM-basierte Code‑Weltmodelle steuern Evolutionäre Algorithmen

Eine neue Studie zeigt, dass große Sprachmodelle (LLMs) nicht nur Texte generieren, sondern auch das Verhalten von Optimierern erlernen und…

arXiv – cs.LG 27.02.2026 05:00

Aktuell

Sind Sie für die KI-Ära „Agentisch“ genug? Silicon Valley hat KI‑Coding‑Agenten entwickelt, die die meisten Routineaufgaben übernehmen können. Der wahre Wettbewerbsvorteil liegt nun nicht mehr in der Programmierung selbst, sondern darin, die richtigen Aufgaben für diese Agenten auszuwählen und zu steuern. Wer heute die Fähigkeit besitzt, die richtigen Fragen zu stellen und die Agenten gezielt einzusetzen, wird in der Technologiebranche die wertvollste Rolle einnehmen.

Wired – AI (Latest) 26.02.2026 19:00

Forschung

Duel‑Evolve: Optimierung von LLM‑Ausgaben ohne externe Belohnungen

Ein neues Verfahren namens Duel‑Evolve nutzt die eigenen Präferenzen eines großen Sprachmodells, um seine Ausgaben zu optimieren, ohne auf…

arXiv – cs.LG 26.02.2026 05:00

Forschung

BAPO: Off‑Policy RL steigert Effizienz von LLMs um 12,5 %

Ein neues Verfahren namens Batch Adaptation Policy Optimization (BAPO) verspricht, die Effizienz von großen Sprachmodellen nach dem Trainin…

arXiv – cs.AI 25.02.2026 05:00

Forschung

LogicGraph: Benchmark für Mehrweg‑logisches Denken mit neuro‑symbolischer Analyse

In der Welt der großen Sprachmodelle (LLMs) liegt der Fokus bislang vor allem auf konvergenter Logik: Modelle sollen einen einzigen, korrek…

arXiv – cs.AI 25.02.2026 05:00

Aktuell

So entfernen Sie KI-Übersichten aus Google-Suche: 4 einfache Wege

Genug von KI-Zusammenfassungen in Ihren Suchergebnissen? Mit ein paar Klicks können Sie die KI-Übersichten deaktivieren und die klassische…

ZDNet – Artificial Intelligence 25.02.2026 16:26

Forschung

Protein-Sprachmodelle: Effizienz und Genauigkeit steigen

Moderne Protein‑Sprachmodelle (PLMs) nutzen Transformer‑Architekturen, die ursprünglich für die Verarbeitung natürlicher Sprache entwickelt…

arXiv – cs.LG 25.02.2026 05:00

Forschung

LaDa: Federiertes Distillationsframework lernfähigkeitsorientierte Datenverteilung

In der Zusammenarbeit von großen Sprachmodellen (LLMs) und kleineren Modellen (SLMs) ist die Verteilung von Daten entscheidend. Ein bislang…

arXiv – cs.AI 24.02.2026 05:00

Produkt

Agentenbasierte KI mit Multi-Modell-Framework: Hugging Face smolagents auf AWS

Hugging Face smolagents ist eine Open‑Source‑Python‑Bibliothek, die es Entwicklern ermöglicht, Agenten mit nur wenigen Zeilen Code zu erste…

AWS – Machine Learning Blog 23.02.2026 15:47

Forschung

Verbalisiertes Aktionsmaskieren steigert Effizienz beim Schach‑RL‑Training

Die Nachtrainierung von großen Sprachmodellen (LLMs) mit Verstärkungslernen (RL) steht vor einer großen Herausforderung: die Erkundung des…

arXiv – cs.LG 20.02.2026 05:00

Forschung

Web Verbs: Typisierte Abstraktionen für zuverlässige Aufgabenkomposition im Web

Die Weblandschaft wandelt sich von einem reinen Browser-Erlebnis zu einer Umgebung, in der Softwareagenten im Namen der Nutzer handeln. Dan…

arXiv – cs.AI 20.02.2026 05:00

Forschung

Agent Skill Framework: Kleine Sprachmodelle in Industrieumgebungen erfolgreich einsetzen

Das Agent Skill Framework, das inzwischen von großen Akteuren wie GitHub Copilot, LangChain und OpenAI offiziell unterstützt wird, hat sich…

arXiv – cs.AI 19.02.2026 05:00

Forschung

HiPER: Hierarchisches RL mit expliziter Kreditzuweisung verbessert LLM-Agenten Die neue Methode HiPER löst ein zentrales Problem bei der Nutzung von großen Sprachmodellen (LLMs) als interaktive Agenten: In Aufgaben mit langen Entscheidungsfolgen und spärlichen, verzögerten Belohnungen ist es schwierig, die Verantwortung für einzelne Aktionen korrekt zuzuordnen. Traditionelle Reinforcement‑Learning‑Ansätze behandeln LLMs als flache Richtlinien, die bei jedem Schritt nur eine Aktion wählen. Dadurch mus

arXiv – cs.LG 19.02.2026 05:00

Forschung

IntentCUA: Intention-basierte Planung für effiziente Desktop‑Automatisierung

Ein brandneues Framework namens IntentCUA hat die Art und Weise, wie Computer‑Use‑Agents lange Aufgaben ausführen, revolutioniert. Durch di…

arXiv – cs.AI 20.02.2026 05:00

Forschung

Kausale Feature‑Engineering mit Multi‑Agent Reinforcement Learning

In einer bahnbrechenden Veröffentlichung stellen Forscher das neue CAFE‑Framework vor, das automatisiertes Feature‑Engineering (AFE) durch…

arXiv – cs.AI 19.02.2026 05:00

Aktuell

Edge erhält neues KI-Tool, das Chrome nicht hat – so probieren Sie es aus

Microsoft Edge hat ein brandneues KI-Tool eingeführt, das PDFs direkt im Browser zusammenfasst und Fragen dazu beantwortet. Durch die Integ…

ZDNet – Artificial Intelligence 19.02.2026 15:42

Aktuell

Kostenlose KI reicht nicht? So wählen Sie den passenden Chatbot und wann ein Upgrade sinnvoll ist

Mit kostenloser KI lassen sich bereits viele Aufgaben erledigen. Ein Upgrade eröffnet jedoch noch mehr Möglichkeiten. So entscheiden Sie, w…

ZDNet – Artificial Intelligence 19.02.2026 14:58

Forschung

LLMs können Meme-Antworten nicht perfekt auswählen – neue Studie zeigt Lücken Eine neue Arbeit aus dem Bereich der Web‑Science stellt die Aufgabe „Meme‑Reply‑Selection“ vor und präsentiert dazu das MaMe‑Re‑Benchmark. Das Datenset umfasst 100.000 Paare aus frei lizenzierten japanischen Manga‑Panels und zugehörigen Social‑Media‑Posts, die von 2.325 unterschiedlichen Annotatoren mit insgesamt 500.000 Anmerkungen bewertet wurden. Die Analyse liefert drei zentrale Erkenntnisse. Erstens zeigen gr

arXiv – cs.LG 19.02.2026 05:00

Aktuell

KI im Agentic Zeitalter: Mehr als nur Chatbots

In der heutigen Agentic Era hat Künstliche Intelligenz ihre Rolle weit über die klassische Chatbot-Funktion hinaus erweitert. Unternehmen s…

Ethan Mollick – One Useful Thing 18.02.2026 01:45

Finde Modelle, Firmen und Themen

Neue Methode steigert Genauigkeit strukturierter LLM-Ausgaben um bis zu 24 %

AgentSelect: Benchmark für narrative Agentenempfehlungen

Neue Methode reduziert widersprüchliche Erklärungen in Empfehlungssystemen

Neurale Operatoren: Zuverlässiger Umgang mit Funktionen außerhalb des Trainings

Certainty-Validity: Diagnose-Framework für diskrete Commitment-Systeme

Neues Framework GUIDE verbessert automatisierte Bewertung von offenen Antworten

Wechsel zu Claude: So übertragen Sie Ihre Erinnerungen und Einstellungen mühelos

TENG-BC: Neural PDE Solver mit hoher Präzision bei zeitabhängigen Gleichungen

PseudoAct: Pseudocode‑Synthese ermöglicht flexible Planung in LLM‑Agenten

FlexMS: Flexibles Benchmark-Framework für Deep‑Learning‑Massenspektrometrie

LLM-basierte Code‑Weltmodelle steuern Evolutionäre Algorithmen

Duel‑Evolve: Optimierung von LLM‑Ausgaben ohne externe Belohnungen

BAPO: Off‑Policy RL steigert Effizienz von LLMs um 12,5 %

LogicGraph: Benchmark für Mehrweg‑logisches Denken mit neuro‑symbolischer Analyse

So entfernen Sie KI-Übersichten aus Google-Suche: 4 einfache Wege

Protein-Sprachmodelle: Effizienz und Genauigkeit steigen

LaDa: Federiertes Distillationsframework lernfähigkeitsorientierte Datenverteilung

Agentenbasierte KI mit Multi-Modell-Framework: Hugging Face smolagents auf AWS

Verbalisiertes Aktionsmaskieren steigert Effizienz beim Schach‑RL‑Training

Web Verbs: Typisierte Abstraktionen für zuverlässige Aufgabenkomposition im Web

Agent Skill Framework: Kleine Sprachmodelle in Industrieumgebungen erfolgreich einsetzen

IntentCUA: Intention-basierte Planung für effiziente Desktop‑Automatisierung

Kausale Feature‑Engineering mit Multi‑Agent Reinforcement Learning

Edge erhält neues KI-Tool, das Chrome nicht hat – so probieren Sie es aus

Kostenlose KI reicht nicht? So wählen Sie den passenden Chatbot und wann ein Upgrade sinnvoll ist

KI im Agentic Zeitalter: Mehr als nur Chatbots

🍪 Cookie-Einstellungen

Neue Methode steigert Genauigkeit strukturierter LLM-Ausgaben um bis zu 24 %

BAPO: Off‑Policy RL steigert Effizienz von LLMs um 12,5 %