Suche nach anisotrop | meineki.news

BeamPERL: RL mit verifizierbaren Belohnungen stärkt physikalisches Denken in kompakteren LLMs

Ein neues Verfahren namens BeamPERL nutzt Reinforcement Learning mit harten, verifizierbaren Belohnungen, um ein 1,5‑Billionen‑Parameter‑Mo…

arXiv – cs.AI 05.03.2026 05:00

Forschung

Zeitreihen‑Vorhersage neu: 2D‑Gaussian‑Splatting liefert Rekordleistung

Die Vorhersage von Zeitreihen bleibt ein komplexes Problem, weil sich kurzfristige Schwankungen und langfristige Trends eng verflechten. Tr…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Chebyshev-Polynome und anisotrope RBF-Modelle in Tabellendatenregression

In einer aktuellen Veröffentlichung auf arXiv wird die Rolle von glatten Basisfunktionen in der Tabellendatenregression neu beleuchtet. Wäh…

arXiv – cs.LG 27.02.2026 05:00

Forschung

Neuer Ansatz: Gaussian-Teilchen-Operator liefert interpretierbare PDE-Lösungen

Die Modellierung von PDE-Dynamiken für Flüssigkeiten hat sich in den letzten Jahren stark auf neuronale Operatoren und Transformer‑basierte…

arXiv – cs.LG 26.02.2026 05:00

Forschung

Soft-MoE: Robustere Exploration in der gerichteten Controller‑Synthese

In der On‑the‑Fly‑Directed Controller Synthesis (OTF‑DCS) wird das Problem der explosionsartigen Zustandsraumgröße durch schrittweise Explo…

arXiv – cs.AI 24.02.2026 05:00

Forschung

PaCoDi: Parallel Complex Diffusion revolutioniert Zeitreihen-Generierung

In einer bahnbrechenden Veröffentlichung auf arXiv präsentiert das Forschungsteam die Methode PaCoDi, die die Generation von Zeitreihen neu…

arXiv – cs.LG 23.02.2026 05:00

Forschung

Neurale Operatoren beschleunigen Neutronentransport – neue Surrogatmodelle

In einer bahnbrechenden Studie wurden zwei moderne neuronale Operatoren – der Deep Operator Network (DeepONet) und der Fourier Neural Opera…

arXiv – cs.AI 19.02.2026 05:00

Forschung

Spectra: Optimierer für LLMs neu gedacht – Anisotrope Spektren im Fokus

In der Ausbildung großer Sprachmodelle (LLMs) zeigen Gradientensignale eine starke Anisotropie: die wiederkehrende sprachliche Struktur kon…

arXiv – cs.LG 13.02.2026 05:00

Forschung

SGD sucht nicht nach Flachheit – Daten bestimmen die Schärfe

Ein neues arXiv‑Veröffentlichung (2602.05065v1) beleuchtet die lange diskutierte Frage, ob der klassische Stochastic Gradient Descent (SGD)…

arXiv – cs.LG 06.02.2026 05:00

Forschung

Stochastische Optimierung: Neue Methode beschleunigt Kalibrierung von Plasmasystemen

Ein neues Optimierungsframework, das sich an der Theorie der „Sloppy Models“ orientiert, wurde vorgestellt. Es ermöglicht die effiziente Ka…

arXiv – cs.LG 06.02.2026 05:00

Forschung

Kalibrierte Ähnlichkeit: Verlässliche geometrische Analyse von Embedding‑Räumen

In vortrainierten Embedding‑Räumen korreliert die rohe Kosinus‑Ähnlichkeit stark mit menschlichen Urteilen, doch die Anisotropie führt zu e…

arXiv – cs.LG 26.01.2026 05:00

Forschung

GeoRA: Geometriebewusste Low‑Rank‑Anpassung verbessert RLVR-Modelle

Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) ist entscheidend für die Weiterentwicklung großer Sprachmodelle. Bisherige, p…

arXiv – cs.LG 15.01.2026 05:00

Forschung

Geometrische Theorie vereint alle kognitiven Prozesse

Eine neue Studie aus dem arXiv-Repository präsentiert ein einheitliches mathematisches Modell, das sämtliche kognitive Fähigkeiten – von Wa…

arXiv – cs.AI 16.12.2025 05:00

Forschung

Neuer Tensor-Analyse-Ansatz liefert theoretische Sicherheit bei hochdimensionalen Daten

In modernen Anwendungen, insbesondere bei tiefen neuronalen Netzen, tauchen hochdimensionale Tensor‑Valued‑Predictoren immer häufiger auf…

arXiv – cs.LG 16.12.2025 05:00

Forschung

Neue Theorie erklärt Dynamik von Agenten-Loops in großen Sprachmodellen

Ein brandneues Papier aus dem arXiv‑Repository liefert einen klaren geometrischen Rahmen, um die Dynamik von Agenten‑Loops in großen Sprach…

arXiv – cs.LG 12.12.2025 05:00

Forschung

FairMT: Gleichberechtigte Multi-Task-Lernmodelle für heterogene Aufgaben

In der Welt des maschinellen Lernens wurde Fairness bislang vorwiegend in Einzeltask-Umgebungen untersucht. Das Feld des fairen Multi-Task-…

arXiv – cs.LG 02.12.2025 05:00

Forschung

Neuer Ansatz: Klassifikatoren gegen Lernkuriositäten mit gezielter Jacobian-Regularisierung

Neuer Forschungsbeitrag aus dem arXiv-Repository präsentiert einen innovativen Weg, um das Problem von „Shortcut Learning“ in tiefen neuron…

arXiv – cs.LG 26.11.2025 05:00

Forschung

42 Jahre hochauflösende Satelliten‑Temperaturdaten für die Arktis

Ein neues, 42‑jähriges LST‑Datensatz für die gesamte Arktis wurde veröffentlicht. Durch die Anwendung eines tiefen anisotropen Diffusionsmo…

arXiv – cs.LG 24.11.2025 05:00

Forschung

Gating in RNNs wirkt wie adaptive Lernrate – neue dynamische Einsicht

Forscher haben herausgefunden, dass die Gating‑Mechanismen in rekurrenten neuronalen Netzwerken (RNNs) selbstständig ein adaptives Lernverh…

arXiv – cs.LG 19.08.2025 05:00

Finde Modelle, Firmen und Themen

BeamPERL: RL mit verifizierbaren Belohnungen stärkt physikalisches Denken in kompakteren LLMs

Zeitreihen‑Vorhersage neu: 2D‑Gaussian‑Splatting liefert Rekordleistung

Chebyshev-Polynome und anisotrope RBF-Modelle in Tabellendatenregression

Neuer Ansatz: Gaussian-Teilchen-Operator liefert interpretierbare PDE-Lösungen

Soft-MoE: Robustere Exploration in der gerichteten Controller‑Synthese

PaCoDi: Parallel Complex Diffusion revolutioniert Zeitreihen-Generierung

Neurale Operatoren beschleunigen Neutronentransport – neue Surrogatmodelle

Spectra: Optimierer für LLMs neu gedacht – Anisotrope Spektren im Fokus

SGD sucht nicht nach Flachheit – Daten bestimmen die Schärfe

Stochastische Optimierung: Neue Methode beschleunigt Kalibrierung von Plasmasystemen

Kalibrierte Ähnlichkeit: Verlässliche geometrische Analyse von Embedding‑Räumen

GeoRA: Geometriebewusste Low‑Rank‑Anpassung verbessert RLVR-Modelle

Geometrische Theorie vereint alle kognitiven Prozesse

Neuer Tensor-Analyse-Ansatz liefert theoretische Sicherheit bei hochdimensionalen Daten

Neue Theorie erklärt Dynamik von Agenten-Loops in großen Sprachmodellen

FairMT: Gleichberechtigte Multi-Task-Lernmodelle für heterogene Aufgaben

Neuer Ansatz: Klassifikatoren gegen Lernkuriositäten mit gezielter Jacobian-Regularisierung

42 Jahre hochauflösende Satelliten‑Temperaturdaten für die Arktis

Gating in RNNs wirkt wie adaptive Lernrate – neue dynamische Einsicht

🍪 Cookie-Einstellungen

42 Jahre hochauflösende Satelliten‑Temperaturdaten für die Arktis