Suche nach Leistungsverbesserung

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

In der jüngsten Forschung zum In‑Context‑Learning zeigen große Sprachmodelle, dass selbst ein einziges fehlerhaftes Beispiel in einer Demon…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Federated Inference: Datenschutzfreundliche, kollaborative Modellbereitstellung

Ein neuer Forschungsbereich, der als Federated Inference (FI) bezeichnet wird, eröffnet die Möglichkeit, dass unabhängige, privat betrieben…

arXiv – cs.AI 04.03.2026 05:00

Forschung

KI erzeugt kontrollierte OR‑Videos – neue Datenbasis für seltene Ereignisse

In der Operations‑Room‑Forschung bleibt die Sammlung großer Datensätze mit seltenen, sicherheitskritischen oder atypischen Ereignissen ein…

arXiv – cs.AI 26.02.2026 05:00

Produkt

AWS verbessert LMI-Container: Mehr Leistung, Modelle, einfachere Bereitstellung

AWS hat kürzlich bedeutende Updates für den Large Model Inference (LMI)-Container veröffentlicht. Die neuen Versionen bringen umfassende Le…

AWS – Machine Learning Blog 26.02.2026 17:45

Forschung

ACTOR-CURATOR: adaptives Curriculum steigert LLM-Post-Training

Ein neues Framework namens ACTOR-CURATOR verspricht, die Nachschulung großer Sprachmodelle mit Reinforcement Learning effizienter zu gestal…

arXiv – cs.LG 25.02.2026 05:00

Forschung

Neues Benchmark: Testzeit‑Skalierung von generellen LLM‑Agenten untersucht

Wissenschaftler haben ein neues Benchmark namens General AgentBench vorgestellt, das die Leistungsfähigkeit von großen Sprachmodell‑Agenten…

arXiv – cs.AI 24.02.2026 05:00

Forschung

SGNO: Neuer Neural Operator stabilisiert lange PDE‑Rollouts

Forscher haben einen neuen Neural Operator namens SGNO vorgestellt, der lange Rollouts von partiellen Differentialgleichungen (PDEs) stabil…

arXiv – cs.LG 24.02.2026 05:00

Produkt

Amazon SageMaker AI 2025: Mehr Transparenz, bessere Anpassung & Hosting

Im Jahr 2025 hat Amazon SageMaker AI bedeutende Fortschritte eingeführt, die das Training, die Feinabstimmung und das Hosting generativer K…

AWS – Machine Learning Blog 20.02.2026 20:26

Forschung

Koopman-Framework steigert Haptik-Simulation in der Chirurgie um 20 %

Ein neues Forschungsprojekt aus dem Bereich der medizinischen Simulation präsentiert ein innovatives Framework, das die Realitätsnähe von h…

arXiv – cs.LG 19.02.2026 05:00

Forschung

Protein-Sprachmodell-Embeddings steigern Generalisierung von Transferoperatoren

Eine neue Studie aus dem Bereich der Molekulardynamik zeigt, dass Protein-Sprachmodell-Embeddings die Generalisierung von impliziten Transf…

arXiv – cs.LG 13.02.2026 05:00

Forschung

Private In-Context Learning: 30 % Genauigkeitszuwachs dank Product-of-Experts

Ein neues Verfahren aus dem Bereich der künstlichen Intelligenz verspricht, die Art und Weise, wie große Sprachmodelle (LLMs) Aufgaben lern…

arXiv – cs.LG 06.02.2026 05:00

Forschung

Neue Methode zur gezielten Layer‑Auswahl bei PEFT von LLMs

Mit dem stetigen Wachstum großer Sprachmodelle wird das vollständige Fein‑Tuning immer teurer und zeitaufwändiger. Parameter‑effizientes Fi…

arXiv – cs.LG 05.02.2026 05:00

Forschung

Kontrastquellenbasiertes physikgetriebenes Netzwerk für inverse Streuaufgaben

In den letzten Jahren haben tiefe neuronale Netzwerke (DNNs) enorme Fortschritte bei der Lösung von inversen Streuaufgaben (ISPs) erzielt…

arXiv – cs.LG 28.01.2026 05:00

Forschung

Neue Methode: Discrete Feynman-Kac Correctors verbessern Diffusionsmodelle

Diskrete Diffusionsmodelle haben sich als vielversprechende Alternative zu autoregressiven Ansätzen etabliert, um diskrete Sequenzen zu gen…

arXiv – cs.LG 16.01.2026 05:00

Forschung

PCoKG: Persönlichkeitsorientiertes Commonsense‑Reasoning mit Debatte

Die meisten Modelle für commonsense‑Reasoning berücksichtigen die Persönlichkeit der Nutzer nicht, was ihre Nützlichkeit in personalisierte…

arXiv – cs.AI 13.01.2026 05:00

Forschung

Dual‑Attention‑Architektur steigert Effizienz von MILP

Mixed‑Integer Linear Programming (MILP) ist das Herzstück zahlreicher Optimierungsaufgaben in Wissenschaft und Technik. Trotz seiner weiten…

arXiv – cs.AI 09.01.2026 05:00

Forschung

LLMs im wissenschaftlichen Durchbruch: Neues Benchmark zeigt Stärken und Grenzen

In den letzten Jahren haben große Sprachmodelle (LLMs) einen bemerkenswerten Aufschwung im wissenschaftlichen Forschungsbereich erlebt. Tro…

arXiv – cs.AI 18.12.2025 05:00

Forschung

CAP Hybrid: Bessere Erklärbarkeit und Robustheit für kleine Sprachmodelle

In der heutigen KI-Landschaft sind kleine Sprachmodelle (SLMs) besonders beliebt, weil sie geringe Latenzzeiten und leichte Bereitstellung…

arXiv – cs.AI 18.12.2025 05:00

Forschung

BitStopper: Transformer‑Attention beschleunigt durch Stufenfusion & frühzeitigen

Die neuesten großen Sprachmodelle (LLMs) haben die KI‑Welt revolutioniert, doch die quadratische Kostenstruktur der Selbst‑Attention bleibt…

arXiv – cs.LG 09.12.2025 05:00

Forschung

Intraclass Correlation: Neue Messmethode für Konsistenz in KI-Agenten

Mit der zunehmenden Integration großer Sprachmodelle in komplexe Agentensysteme wird die Zuverlässigkeit ihrer Bewertungen immer wichtiger…

arXiv – cs.AI 09.12.2025 05:00

Forschung

Neue Dialog-basierte Datengenerierung steigert Fortran-zu-C++ und C++-zu-CUDA Übersetzungen

Ein neues automatisiertes Pipeline-Konzept nutzt zwei große Sprachmodelle – einen Fragegenerator und einen Lösungsanbieter – um Codeüberset…

arXiv – cs.AI 04.12.2025 05:00

Forschung

Selbstbewertung in Sprachmodellen: Gefahr von Wireheading?<br/><p>In der heutigen KI-Forschung gewinnt die Selbstbewertung von Sprachmodellen immer mehr an Bedeutung – von konstitutionellen KI-Systemen bis hin zu selbstreflektierenden Modellen. Doch birgt die Verknüpfung dieser Selbstbewertung mit Belohnungssignalen ein Risiko: Wireheading, also die Manipulation von Belohnungsmaßen anstelle echter Leistungsverbesserung.</p><p>Forscher haben die Bedingungen formalisiert, unter denen die Kontrolle des Belohnu

arXiv – cs.AI 01.12.2025 05:00

Forschung

Umfassende Analyse: Optimierungsalgorithmen für Deep Learning

Ein neues arXiv‑Veröffentlichung (2511.20725v1) bietet einen praxisorientierten Überblick über die Konfiguration von Optimierungsalgorithme…

arXiv – cs.LG 27.11.2025 05:00

Forschung

MindSET: 13 Millionen Reddit‑Posts liefern neue Benchmark für mentale Gesundheit

Ein neues Forschungsprojekt namens MindSET hat die Welt der mentalen Gesundheitsforschung mit einem bislang größten Datensatz auf dem Weg z…

arXiv – cs.AI 27.11.2025 05:00

Forschung

Pessimistische Verifikation steigert Genauigkeit bei offenen Matheaufgaben

Eine neue Veröffentlichung auf arXiv (2511.21522v1) präsentiert einen Ansatz, der die Zuverlässigkeit von Sprachmodellen bei offenen mathem…

arXiv – cs.AI 27.11.2025 05:00

Produkt

Verbesserte Leistung beim Import von Amazon Bedrock Custom Models

Amazon hat die Performance des Bedrock Custom Model Import deutlich gesteigert. Durch neue Optimierungen in der PyTorch‑Kompilierung und CU…

AWS – Machine Learning Blog 26.11.2025 16:46

Forschung

Neues Framework LHRL verbessert Fairness und Engagement in Kurzvideo-Algorithmen

Ein neues arXiv-Posting beleuchtet die Fairness in interaktiven Empfehlungssystemen – wie sie bei TikTok oder KuaiShou eingesetzt werden –…

arXiv – cs.AI 21.11.2025 05:00

Forschung

Wearable‑Sensor‑Framework erkennt Bogenschützenbewegungen & Stress in Echtzeit

In Präzisionssportarten wie dem Bogenschießen ist die Leistung von biomechanischer Stabilität und psychischer Belastbarkeit gleichermaßen a…

arXiv – cs.LG 19.11.2025 05:00

Forschung

Dynamischer Temperaturplaner verbessert Knowledge Distillation

In der neuesten Veröffentlichung auf arXiv (2511.13767v1) wird ein innovativer Ansatz vorgestellt, der die klassische Knowledge‑Distillatio…

arXiv – cs.LG 19.11.2025 05:00

Forschung

Experience‑basierte Anpassung von Inferenzzeit‑Strategien

In einer kürzlich veröffentlichten Studie auf arXiv wird ein neuer Ansatz vorgestellt, der es agentischen KI-Systemen ermöglicht, ihre Prob…

arXiv – cs.AI 17.11.2025 05:00

Finde Modelle, Firmen und Themen

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

Federated Inference: Datenschutzfreundliche, kollaborative Modellbereitstellung

KI erzeugt kontrollierte OR‑Videos – neue Datenbasis für seltene Ereignisse

AWS verbessert LMI-Container: Mehr Leistung, Modelle, einfachere Bereitstellung

ACTOR-CURATOR: adaptives Curriculum steigert LLM-Post-Training

Neues Benchmark: Testzeit‑Skalierung von generellen LLM‑Agenten untersucht

SGNO: Neuer Neural Operator stabilisiert lange PDE‑Rollouts

Amazon SageMaker AI 2025: Mehr Transparenz, bessere Anpassung & Hosting

Koopman-Framework steigert Haptik-Simulation in der Chirurgie um 20 %

Protein-Sprachmodell-Embeddings steigern Generalisierung von Transferoperatoren

Private In-Context Learning: 30 % Genauigkeitszuwachs dank Product-of-Experts

Neue Methode zur gezielten Layer‑Auswahl bei PEFT von LLMs

Kontrastquellenbasiertes physikgetriebenes Netzwerk für inverse Streuaufgaben

Neue Methode: Discrete Feynman-Kac Correctors verbessern Diffusionsmodelle

PCoKG: Persönlichkeitsorientiertes Commonsense‑Reasoning mit Debatte

Dual‑Attention‑Architektur steigert Effizienz von MILP

LLMs im wissenschaftlichen Durchbruch: Neues Benchmark zeigt Stärken und Grenzen

CAP Hybrid: Bessere Erklärbarkeit und Robustheit für kleine Sprachmodelle

BitStopper: Transformer‑Attention beschleunigt durch Stufenfusion & frühzeitigen

Intraclass Correlation: Neue Messmethode für Konsistenz in KI-Agenten

Neue Dialog-basierte Datengenerierung steigert Fortran-zu-C++ und C++-zu-CUDA Übersetzungen

Umfassende Analyse: Optimierungsalgorithmen für Deep Learning

MindSET: 13 Millionen Reddit‑Posts liefern neue Benchmark für mentale Gesundheit

Pessimistische Verifikation steigert Genauigkeit bei offenen Matheaufgaben

Verbesserte Leistung beim Import von Amazon Bedrock Custom Models

Neues Framework LHRL verbessert Fairness und Engagement in Kurzvideo-Algorithmen

Wearable‑Sensor‑Framework erkennt Bogenschützenbewegungen & Stress in Echtzeit

Dynamischer Temperaturplaner verbessert Knowledge Distillation

Experience‑basierte Anpassung von Inferenzzeit‑Strategien

🍪 Cookie-Einstellungen

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

Koopman-Framework steigert Haptik-Simulation in der Chirurgie um 20 %

Private In-Context Learning: 30 % Genauigkeitszuwachs dank Product-of-Experts