Suche nach Scaling | meineki.news

DreamCAD: Mehrdimensionale CAD-Generierung ohne CAD-spezifische Annotationen

Die neue Methode DreamCAD eröffnet die Möglichkeit, komplexe CAD-Modelle aus einfachen Punktwolken zu erzeugen, ohne dass dafür aufwändige…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Starke Modelle lernen von schwachen Lehrern: Neue Skalierungsgesetze

In der modernen KI‑Forschung ist es üblich, ein bereits trainiertes Modell zu nutzen, um Daten zu kennzeichnen, und diese gekennzeichneten…

arXiv – cs.LG 09.03.2026 04:00

Forschung

Vermeidung von Lernstillstand PPO Skalierung auf 1 Million Parallelumgebungen

Plateaus – Phasen, in denen ein Agent bei PPO nicht mehr Fortschritte macht – sind ein häufiges Problem in der on‑policy‑Reinforcement‑Lear…

arXiv – cs.LG 09.03.2026 04:00

Forschung

Timer‑S1: Milliarden‑Skaliges Zeitreihen‑Modell mit Serial Scaling

Timer‑S1 ist ein neues Mixture‑of‑Experts‑Modell für Zeitreihen, das mit 8,3 Milliarden Parametern und 0,75 Milliarden aktivierten Paramete…

arXiv – cs.AI 06.03.2026 05:00

Aktuell

Intelligente Automatisierung skalieren – ohne Live‑Workflows zu brechen

Die Skalierung intelligenter Automatisierung erfordert einen Fokus auf architektonische Elastizität, nicht nur die Bereitstellung weiterer…

AI News (TechForge) 06.03.2026 13:15

Aktuell

KI skalieren erfordert vertrauenswürdige Daten – CDOs setzen auf Qualitätslösungen

Eine aktuelle Befragung von Chief Data Officers zeigt, dass die Hälfte der Unternehmen, die agentische KI einsetzen, Datenqualitäts- und Ab…

ZDNet – Artificial Intelligence 06.03.2026 02:00

Forschung

Verteilungsbasierte Vertrauenskalibrierung verbessert KI-Modelle

In der Welt der großen Sprachmodelle hat die Technik des Test‑Time‑Scalings die Genauigkeit von Vorhersagen deutlich gesteigert, indem mehr…

arXiv – cs.LG 05.03.2026 05:00

Forschung

TikZilla: KI erzeugt hochwertige TikZ-Programme mit großen Daten und RL

Wissenschaftler nutzen immer häufiger große Sprachmodelle, um komplexe Grafiken aus Textbeschreibungen zu generieren. Dabei kommt TikZ – ei…

arXiv – cs.AI 04.03.2026 05:00

Forschung

<h1>Label-basierte Distanzskalierung verbessert Few-Shot-Textklassifikation</h1> <p>In der Welt der Few-Shot-Textklassifikation, bei der Modelle unbekannte Klassen mit nur wenigen gelabelten Textproben erkennen sollen, gibt es ein zentrales Problem: Während des Trainings werden komplexe Algorithmen entwickelt, doch die gelabelten Stichproben, die im Test verwendet werden, werden zufällig ausgewählt. Dadurch erhalten die Modelle oft keine wirklichen Leitfäden, was zu Fehlklassifikationen führt.</p> <p>Die ne

arXiv – cs.LG 04.03.2026 05:00

Forschung

Reward-Modelle ohne menschliche Hilfe: Skalierung durch unüberwachtes Lernen

Forscher haben einen neuen Ansatz vorgestellt, mit dem Belohnungsmodelle ohne menschliche Annotationen skaliert werden können. Durch das Tr…

arXiv – cs.LG 04.03.2026 05:00

Forschung

DIG: Dynamische Interaktionsgraphen ermöglichen erklärbare Agenten‑Kollaboration

Die neue Arbeit auf arXiv (2603.00309v1) präsentiert DIG – einen dynamischen Interaktionsgraphen, der die Zusammenarbeit von generischen La…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Neues Schlaf-Foundation-Modell OSF setzt Maßstäbe in Präzision und Skalierbarkeit

Polysomnographie (PSG) gilt als Goldstandard zur Schlafbewertung, leidet jedoch unter großer Heterogenität der Messgeräte und Probandengrup…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Tiefe Decoder steigern Routing-Modelle: Neue Skalierungsstrategie

Ein neuer Beitrag auf arXiv untersucht, wie neuronale Routing‑Solver – die aus einem Encoder und einem Decoder bestehen – effizienter skali…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Duel‑Evolve: Optimierung von LLM‑Ausgaben ohne externe Belohnungen

Ein neues Verfahren namens Duel‑Evolve nutzt die eigenen Präferenzen eines großen Sprachmodells, um seine Ausgaben zu optimieren, ohne auf…

arXiv – cs.LG 26.02.2026 05:00

Forschung

Neues Transformer-Modell setzt neue Maßstäbe in der Ansichtssynthese

Ein neues Forschungsergebnis aus dem Bereich der Bildsynthese zeigt, dass Transformer-Modelle ohne geometrische Vorinformationen die bisher…

arXiv – cs.AI 26.02.2026 05:00

Praxis

LFM2-24B-A2B – Hybrid kombiniert Attention & Convolution bei Skalierungsengpässen

Der Wettlauf um die größte generative KI war lange Zeit ein Spiel des „größer ist besser“. Doch die Grenzen des Stromverbrauchs und der Spe…

MarkTechPost 25.02.2026 08:37

Forschung

GeoPT: Physiksimulationen skalieren mit synthetischer Dynamik

Neurale Simulationsmodelle versprechen effiziente Ersatzlösungen für physikalische Simulationen, doch ihre Skalierbarkeit wird durch den en…

arXiv – cs.LG 25.02.2026 05:00

Forschung

Neues Benchmark: Testzeit‑Skalierung von generellen LLM‑Agenten untersucht

Wissenschaftler haben ein neues Benchmark namens General AgentBench vorgestellt, das die Leistungsfähigkeit von großen Sprachmodell‑Agenten…

arXiv – cs.AI 24.02.2026 05:00

Produkt

Skalierung der Datenannotation mit Vision‑Language-Modellen für physische KI

Bedrock Robotics hat sich der Herausforderung gestellt, die Datenannotation für physische KI-Systeme zu skalieren. Durch die Teilnahme am A…

AWS – Machine Learning Blog 23.02.2026 23:20

Forschung

CodeScaler: Code-LLM-Training ohne Ausführung, schneller & besser

Die neueste Veröffentlichung von CodeScaler verspricht, die Art und Weise, wie Code-LLMs trainiert und eingesetzt werden, grundlegend zu ve…

arXiv – cs.AI 23.02.2026 05:00

Forschung

LATMiX: Lernbare Affine-Transformationen für die Microskalierung von LLMs

Die Post‑Training‑Quantisierung (PTQ) bleibt ein zentraler Ansatz, um die Speicher‑ und Rechenkosten großer Sprachmodelle drastisch zu senk…

arXiv – cs.LG 23.02.2026 05:00

Forschung

NVIDIA cuLitho beschleunigt Lithografie um 57‑fach – schneller, energieeffizient

Die Anforderungen an wissenschaftliches Rechnen sind in den letzten Jahren rasant gewachsen – von der Klimaforschung bis zur Wirkstoffentwi…

arXiv – cs.AI 18.02.2026 05:00

Forschung

Neue Skalierungsformeln enthüllen die Entwicklung von Sprachmodellfähigkeiten

Forscher haben ein neues Verfahren zur Vorhersage der Leistungsfähigkeit von Sprachmodellen entwickelt, das auf präzisen Skalierungsregeln…

arXiv – cs.LG 18.02.2026 05:00

Forschung

SSLogic: Agentisches Meta‑Synthese‑Framework für logisches RL

Die Skalierung überprüfbarer Trainingssignale bleibt ein entscheidender Engpass für Reinforcement Learning from Verifiable Rewards (RLVR)…

arXiv – cs.AI 17.02.2026 05:00

Forschung

Maskierte Rekonstruktions-Transformer zeigen Skalierung in Einzelzell-Genomik

Neutrale Skalierungsgesetze, die bisher vor allem in der Sprach- und Bildverarbeitung bekannt waren, haben nun ihre Relevanz in der Einzelz…

arXiv – cs.LG 18.02.2026 05:00

Forschung

Diffusionsbasierte Downscaling liefert hochauflösende Klimaprognosen aus leichtem Emulator

In einer wegweisenden Veröffentlichung auf arXiv (2602.13416v1) zeigen Guan und Kollegen, wie ein schlanker, physik-konsistenter Klimaeinbe…

arXiv – cs.LG 17.02.2026 05:00

Forschung

Quantisierungskonflikt: Weniger Bits kosten mehr Energie

Ein neuer Beitrag auf arXiv zeigt, dass die weit verbreitete Annahme, dass geringere Präzision immer zu mehr Effizienz führt, bei komplexen…

arXiv – cs.AI 17.02.2026 05:00

Forschung

TrasMuon: Vertrauenbasierte Skalierung für orthogonale Momentum-Optimierer

Muons, eine Familie von Optimierern, nutzt Newton-Schulz-Iteration, um die Update-Schritte zu orthogonalisieren. Dadurch entsteht eine nahe…

arXiv – cs.LG 17.02.2026 05:00

Forschung

Automatisierte Datengenerierung und präzise Bewertung für Web-Agenten-Training

Ein neues Verfahren ermöglicht es, große Mengen hochwertiger Trainingsdaten für Web‑Agenten automatisch zu erzeugen. Dabei liegt der Fokus…

arXiv – cs.AI 16.02.2026 05:00

Forschung

<p>Tiefe Jacobian-Spektren trennen sich: Exponentielle Skalierung und Vektor‑Alignment</p> <p>In einer neuen Studie von Forschern auf arXiv wird erklärt, warum das Training tiefer neuronaler Netze mit Gradientenverfahren einen starken impliziten Bias aufweist. Der Schlüssel liegt in der Art und Weise, wie die Singularwerte der Jacobian‑Matrix mit zunehmender Tiefe exponentiell skalieren und sich stark voneinander trennen.</p> <p>Die Autoren nutzen einen „fixed‑gates“-Ansatz für Stückweise-lineare Netzwerke,

arXiv – cs.AI 16.02.2026 05:00

Finde Modelle, Firmen und Themen

DreamCAD: Mehrdimensionale CAD-Generierung ohne CAD-spezifische Annotationen

Starke Modelle lernen von schwachen Lehrern: Neue Skalierungsgesetze

Vermeidung von Lernstillstand PPO Skalierung auf 1 Million Parallelumgebungen

Timer‑S1: Milliarden‑Skaliges Zeitreihen‑Modell mit Serial Scaling

Intelligente Automatisierung skalieren – ohne Live‑Workflows zu brechen

KI skalieren erfordert vertrauenswürdige Daten – CDOs setzen auf Qualitätslösungen

Verteilungsbasierte Vertrauenskalibrierung verbessert KI-Modelle

TikZilla: KI erzeugt hochwertige TikZ-Programme mit großen Daten und RL

Reward-Modelle ohne menschliche Hilfe: Skalierung durch unüberwachtes Lernen

DIG: Dynamische Interaktionsgraphen ermöglichen erklärbare Agenten‑Kollaboration

Neues Schlaf-Foundation-Modell OSF setzt Maßstäbe in Präzision und Skalierbarkeit

Tiefe Decoder steigern Routing-Modelle: Neue Skalierungsstrategie

Duel‑Evolve: Optimierung von LLM‑Ausgaben ohne externe Belohnungen

Neues Transformer-Modell setzt neue Maßstäbe in der Ansichtssynthese

LFM2-24B-A2B – Hybrid kombiniert Attention & Convolution bei Skalierungsengpässen

GeoPT: Physiksimulationen skalieren mit synthetischer Dynamik

Neues Benchmark: Testzeit‑Skalierung von generellen LLM‑Agenten untersucht

Skalierung der Datenannotation mit Vision‑Language-Modellen für physische KI

CodeScaler: Code-LLM-Training ohne Ausführung, schneller & besser

LATMiX: Lernbare Affine-Transformationen für die Microskalierung von LLMs

NVIDIA cuLitho beschleunigt Lithografie um 57‑fach – schneller, energieeffizient

Neue Skalierungsformeln enthüllen die Entwicklung von Sprachmodellfähigkeiten

SSLogic: Agentisches Meta‑Synthese‑Framework für logisches RL

Maskierte Rekonstruktions-Transformer zeigen Skalierung in Einzelzell-Genomik

Diffusionsbasierte Downscaling liefert hochauflösende Klimaprognosen aus leichtem Emulator

Quantisierungskonflikt: Weniger Bits kosten mehr Energie

TrasMuon: Vertrauenbasierte Skalierung für orthogonale Momentum-Optimierer

Automatisierte Datengenerierung und präzise Bewertung für Web-Agenten-Training

🍪 Cookie-Einstellungen

Vermeidung von Lernstillstand PPO Skalierung auf 1 Million Parallelumgebungen