Suche nach Rechenaufgabe

Transformer-MLPs: Hälfte der Nichtlinearität verschwendet – spart Rechenleistung

Eine neue Studie auf arXiv zeigt, dass bei Transformer‑Modellen bis zu die Hälfte der nichtlinearen Berechnungen im MLP‑Block unnötig ist…

arXiv – cs.LG 05.03.2026 05:00

Forschung

TTSR: Selbstreflexion im Testzeitraum für kontinuierliche Verbesserungen der Logik

Ein neues Verfahren namens TTSR (Test‑Time Self‑Reflection) ermöglicht es großen Sprachmodellen, ihre Rechenfähigkeiten während des Testens…

arXiv – cs.AI 05.03.2026 05:00

Forschung

MedCalc-Bench: Benchmark misst nicht, was erwartet – Open‑Book liefert 85 %

Der bislang populäre MedCalc‑Bench, der die Leistungsfähigkeit von Sprachmodellen bei klinischen Rechenaufgaben misst, liefert laut einer n…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Metakognitive Feinabstimmung macht KI-Modelle robuster

In der neuesten Studie von Forschern auf arXiv wird gezeigt, dass große Sprachmodelle bei komplexen Rechenaufgaben häufig scheitern – nicht…

arXiv – cs.AI 27.02.2026 05:00

Forschung

K-Search: KI-gestützte GPU-Kernel-Optimierung mit ko-evolutionärem Weltmodell

Die Optimierung von GPU‑Kerneln ist ein entscheidender Faktor für die Leistungsfähigkeit moderner Machine‑Learning‑Systeme. Trotz zahlreich…

arXiv – cs.AI 24.02.2026 05:00

Forschung

Mehrfach-Grokking: Geometrische Entdeckungen in Transformers

In einer brandneuen Studie auf arXiv wird das Phänomen des Grokking – die plötzliche Übergang von bloßem Auswendiglernen zu echter Generali…

arXiv – cs.LG 24.02.2026 05:00

Forschung

InfEngine: Selbstprüfende, selbstoptimierende KI für Infrarot-Computing

Infrarotstrahlungsrechnen ist ein Schlüsselbereich für Klimaforschung, Fernerkundung und Spektroskopie, doch die meisten Abläufe bleiben no…

arXiv – cs.AI 24.02.2026 05:00

Forschung

Frühwarnsignal für Grokking: Kommutator‑Defekt in Loss‑Landschaft

In einer neuen Studie wurde das Phänomen „Grokking“ – die plötzliche Umwandlung von bloßem Auswendiglernen in echtes Verstehen nach langem…

arXiv – cs.LG 20.02.2026 05:00

Forschung

Interaktives In-Context-Lernen: Sprachliches Feedback steigert Modellleistung

Ein neues Forschungsframework aus dem Bereich der großen Sprachmodelle zeigt, dass die Fähigkeit, aus sprachlichem Feedback zu lernen, gezi…

arXiv – cs.AI 19.02.2026 05:00

Forschung

Ein neues Verfahren namens Recursive Concept Evolution (RCE) verspricht, die Leistungsfähigkeit großer Sprachmodelle bei komplexen Rechenaufgaben deutlich zu erhöhen. Obwohl moderne LLMs bei vielen Aufgaben brillieren, verlieren sie bei Benchmark-Tests, die tiefes Zusammenspiel von Konzepten erfordern, an Genauigkeit. Dazu zählen ARC‑AGI‑2, GPQA, MATH, BBH und HLE. RCE erlaubt es dem Modell, während der Inferenz seine internen Repräsentationen dynamisch zu verändern, indem es neue, niedrigd

arXiv – cs.AI 18.02.2026 05:00

Forschung

Sicheres, energieeffizientes Agenten-Netzwerk für KI-Reasoning

In einer neuen Studie wird ein sicheres drahtloses Agenten-Netzwerk vorgestellt, das aus einem überwachenden KI-Agenten und mehreren unters…

arXiv – cs.AI 18.02.2026 05:00

Forschung

RL-Feinabstimmung von VLMs: Robustheit und Konsistenz der Gedankenketten im Fokus

Reinforcement‑Learning‑Feinabstimmung (RL‑FT) hat sich bei großen Sprachmodellen als entscheidendes Verfahren zur Verbesserung von Rechenau…

arXiv – cs.LG 16.02.2026 05:00

Forschung

KI-Systeme glänzen bei Mathe-Wettbewerben, scheitern aber bei einfacher Addition

Ein neues arXiv‑Veröffentlichung (2602.10416v1) beleuchtet ein überraschendes Phänomen: Während moderne KI‑Modelle bereits Medaillen bei in…

arXiv – cs.LG 12.02.2026 05:00

Forschung

ESTAR: Frühzeitiges Stoppen von Token-bewusstem Denken steigert Effizienz

Ein neues Verfahren namens ESTAR (Early‑Stopping for Token‑Aware Reasoning) ermöglicht es großen Rechenmodellen, lange Gedankenketten effiz…

arXiv – cs.AI 11.02.2026 05:00

Forschung

Hybrid-Parallelität für große Sprachmodelle: Systematischer Leitfaden und Vergleich

Eine neue Studie auf arXiv (2602.09109v1) liefert einen umfassenden Überblick über die neuesten Ansätze zur Verteilung von Rechenleistung u…

arXiv – cs.LG 11.02.2026 05:00

Forschung

Adaptive Retrieval verbessert LLM-Logik – aber nur selten

In einer neuen Studie von arXiv:2602.07213v1 wird aufgezeigt, warum große Sprachmodelle (LLMs) bei komplexen Rechenaufgaben oft scheitern…

arXiv – cs.LG 10.02.2026 05:00

Forschung

AgentArk: Mehrere Agenten in einem LLM – effizienter und robuster

Ein neues Forschungsprojekt namens AgentArk zeigt, wie die Leistungsfähigkeit von Multi-Agenten-Systemen in ein einzelnes Sprachmodell inte…

arXiv – cs.AI 05.02.2026 05:00

Forschung

Empirical-MCTS: Agentenentwicklung durch Dual-Experience-MCTS

Die neuesten Skalierungsstrategien für die Inferenzzeit, insbesondere Monte‑Carlo‑Tree‑Search (MCTS), haben die Problemlösungsfähigkeiten g…

arXiv – cs.AI 05.02.2026 05:00

Forschung

CoRe: Kontextrobuste Remasking-Technik verbessert Diffusion-Sprachmodelle

Die Standard-Decodierung in Masked Diffusion Models (MDMs) leidet unter einer zu starren Kontextbehandlung: Tokens werden auf Basis von kur…

arXiv – cs.LG 05.02.2026 05:00

Forschung

TinyLoRA: Mit nur 13 Parametern 91 % Genauigkeit auf GSM8K erreichen

In einer neuen Studie wird gezeigt, dass Sprachmodelle mit einer extrem kleinen Anzahl von trainierbaren Parametern lernen können, komplexe…

arXiv – cs.LG 05.02.2026 05:00

Forschung

Weniger Fragen, mehr Erkenntnis: Unsicherheitskonsistenz verbessert RLVR

Die jüngsten Fortschritte bei großen Sprachmodellen (LLMs) haben die mathematische Problemlösung durch Reinforcement Learning with Verifiab…

arXiv – cs.AI 02.02.2026 05:00

Praxis

Microsoft präsentiert Maia 200: KI-Accelerator für Azure‑Datencenter

Microsoft hat den Maia 200 vorgestellt, einen eigenen KI‑Accelerator, der speziell für die Inferenz in Azure‑Datencentern entwickelt wurde…

MarkTechPost 30.01.2026 09:01

Forschung

Neues Benchmark und Framework steigern KI‑Genauigkeit in Finanzberechnungen

Große Sprachmodelle (LLMs) haben sich als Meister der semantischen Analyse etabliert, doch bei der finanziellen Quantifizierung stoßen sie…

arXiv – cs.AI 30.01.2026 05:00

Forschung

LLM-Logik neu gedacht: PoT steigert Reasoning um 50 % bei LiveCodeBench Ein neues Verfahren namens Policy of Thoughts (PoT) hat die Art und Weise, wie große Sprachmodelle (LLMs) komplexe, langanhaltende Aufgaben lösen, grundlegend verändert. Während herkömmliche Modelle bei tiefgreifenden Rechenaufgaben oft an ihre Grenzen stoßen, nutzt PoT die Idee, dass Intelligenz aus dem ständigen Lernen an Fehlern entsteht. PoT betrachtet das Denken als einen Online-Optimierungsprozess innerhalb einer

arXiv – cs.AI 29.01.2026 05:00

Forschung

LLEP: Schnellere, Speicherfreundlichere MoE-Modelle dank dynamischer Lastverteilung

In der Welt der großen Sprachmodelle, die auf Mixture-of-Experts (MoE) setzen, ist die effiziente Verteilung von Rechenaufgaben entscheiden…

arXiv – cs.LG 27.01.2026 05:00

Forschung

M3Kang: Neues Mehrsprachiges Datenset für mathematisches Multimodales Denken

Vision‑Language‑Modelle (VLMs) haben in den letzten Jahren beeindruckende Fortschritte bei der Beantwortung komplexer Fragen erzielt, doch…

arXiv – cs.AI 26.01.2026 05:00

Forschung

Martingale Foresight Sampling: Neue Methode für effizientere LLM-Decodierung

Die herkömmliche autoregressive Decodierung großer Sprachmodelle (LLMs) ist von Natur aus kurzsichtig und kann bei komplexen Aufgaben oft k…

arXiv – cs.LG 23.01.2026 05:00

Forschung

Wissensgraphen als Belohnungsmodelle: Pfadbasierte Signale fördern Denken

Eine neue Veröffentlichung auf arXiv präsentiert einen innovativen Ansatz, mit dem große Sprachmodelle ihre Fähigkeiten im mehrstufigen, zu…

arXiv – cs.AI 22.01.2026 05:00

Forschung

KI-Modelle meistern mathematische Rätsel dank neuer „Trap‑Aware“ Technik

Wissenschaftler haben eine neue Methode entwickelt, die große Sprachmodelle dabei unterstützt, komplexe mathematische Aufgaben korrekt zu l…

arXiv – cs.AI 21.01.2026 05:00

Forschung

Dynamische Demonstrationsinsertion verbessert mathematisches Denken bei LLMs

In der Forschung zu großen Sprachmodellen (LLMs) hat sich das In-Context Learning (ICL) als äußerst wirkungsvoll erwiesen, doch seine Anwen…

arXiv – cs.AI 21.01.2026 05:00

Finde Modelle, Firmen und Themen

Transformer-MLPs: Hälfte der Nichtlinearität verschwendet – spart Rechenleistung

TTSR: Selbstreflexion im Testzeitraum für kontinuierliche Verbesserungen der Logik

MedCalc-Bench: Benchmark misst nicht, was erwartet – Open‑Book liefert 85 %

Metakognitive Feinabstimmung macht KI-Modelle robuster

K-Search: KI-gestützte GPU-Kernel-Optimierung mit ko-evolutionärem Weltmodell

Mehrfach-Grokking: Geometrische Entdeckungen in Transformers

InfEngine: Selbstprüfende, selbstoptimierende KI für Infrarot-Computing

Frühwarnsignal für Grokking: Kommutator‑Defekt in Loss‑Landschaft

Interaktives In-Context-Lernen: Sprachliches Feedback steigert Modellleistung

Sicheres, energieeffizientes Agenten-Netzwerk für KI-Reasoning

RL-Feinabstimmung von VLMs: Robustheit und Konsistenz der Gedankenketten im Fokus

KI-Systeme glänzen bei Mathe-Wettbewerben, scheitern aber bei einfacher Addition

ESTAR: Frühzeitiges Stoppen von Token-bewusstem Denken steigert Effizienz

Hybrid-Parallelität für große Sprachmodelle: Systematischer Leitfaden und Vergleich

Adaptive Retrieval verbessert LLM-Logik – aber nur selten

AgentArk: Mehrere Agenten in einem LLM – effizienter und robuster

Empirical-MCTS: Agentenentwicklung durch Dual-Experience-MCTS

CoRe: Kontextrobuste Remasking-Technik verbessert Diffusion-Sprachmodelle

TinyLoRA: Mit nur 13 Parametern 91 % Genauigkeit auf GSM8K erreichen

Weniger Fragen, mehr Erkenntnis: Unsicherheitskonsistenz verbessert RLVR

Microsoft präsentiert Maia 200: KI-Accelerator für Azure‑Datencenter

Neues Benchmark und Framework steigern KI‑Genauigkeit in Finanzberechnungen

LLEP: Schnellere, Speicherfreundlichere MoE-Modelle dank dynamischer Lastverteilung

M3Kang: Neues Mehrsprachiges Datenset für mathematisches Multimodales Denken

Martingale Foresight Sampling: Neue Methode für effizientere LLM-Decodierung

Wissensgraphen als Belohnungsmodelle: Pfadbasierte Signale fördern Denken

KI-Modelle meistern mathematische Rätsel dank neuer „Trap‑Aware“ Technik

Dynamische Demonstrationsinsertion verbessert mathematisches Denken bei LLMs

🍪 Cookie-Einstellungen

MedCalc-Bench: Benchmark misst nicht, was erwartet – Open‑Book liefert 85 %

TinyLoRA: Mit nur 13 Parametern 91 % Genauigkeit auf GSM8K erreichen