Suche nach Jacobi | meineki.news

VINA: Variational Invertible Neural Architectures – Wege im Modellieren

Ein neues arXiv‑Paper (2602.20480v1) präsentiert VINA, ein einheitliches Konzept, das die Stärken von Normalizing Flows (NFs) und Invertibl…

arXiv – cs.LG 25.02.2026 05:00

Forschung

Transformer‑Stabilität: Neue Theorie erklärt Sensitivität und Architektur

In einer bahnbrechenden Studie wird die bislang rätselhafte Zerbrechlichkeit von Transformer‑Modellen endlich entschlüsselt. Die Autoren pr…

arXiv – cs.LG 24.02.2026 05:00

Forschung

Tiefe Jacobian-Spektren trennen sich: Exponentielle Skalierung und Vektor‑Alignment In einer neuen Studie von Forschern auf arXiv wird erklärt, warum das Training tiefer neuronaler Netze mit Gradientenverfahren einen starken impliziten Bias aufweist. Der Schlüssel liegt in der Art und Weise, wie die Singularwerte der Jacobian‑Matrix mit zunehmender Tiefe exponentiell skalieren und sich stark voneinander trennen. Die Autoren nutzen einen „fixed‑gates“-Ansatz für Stückweise-lineare Netzwerke,

arXiv – cs.AI 16.02.2026 05:00

Forschung

Ein neues Papier auf arXiv (2602.11320v1) präsentiert einen Ansatz, der die Rechenlast von Neural Tangent Kernel (NTK)-Methoden drastisch senkt. Traditionell erfordern NTK-Analysen die Auswertung riesiger Jacobian-Matrizen über viele Datenpunkte, was die Skalierbarkeit stark begrenzt. Die Autoren zeigen, dass die Komplexität nicht nur durch Projektion und Sketching der Jacobian reduziert werden kann, sondern auch durch eine gezielte Kompression der Datendimension mittels NTK‑angepasster Datensatzd

arXiv – cs.LG 13.02.2026 05:00

Forschung

Neues analytisches Framework für differenzierbare hydrologische Modelle

Konzeptuelle Hydrologiemodelle bilden seit jeher die Basis für Regen‑Wasser‑Abfluss‑Simulationen. Ihre Kalibrierung ist jedoch oft langsam…

arXiv – cs.LG 09.02.2026 05:00

Forschung

GeoIB: Geometrisch fundiertes Information Bottleneck ohne MI-Schätzung

In der Welt des Deep Learning wird das Information Bottleneck (IB) häufig über indirekte Schätzungen der gegenseitigen Information (MI) umg…

arXiv – cs.AI 05.02.2026 05:00

Forschung

MeanCache beschleunigt Flow-Matching-Modelle um bis zu 4,56× – neue caching-Strategie

Mit MeanCache wird die Inferenz von Flow‑Matching‑Modellen ohne zusätzliche Trainingsschritte deutlich schneller. Während bisherige Caching…

arXiv – cs.LG 29.01.2026 05:00

Forschung

Neue Methode enthüllt, welche Tokens LLMs bei Vorhersagen beeinflussen

Forscher haben eine neue Technik namens Jacobian Scopes entwickelt, die es ermöglicht, genau zu bestimmen, welche einzelnen Tokens in einem…

arXiv – cs.AI 26.01.2026 05:00

Forschung

Neues Verfahren prüft Genauigkeit von PINNs mit Fisher-Information

In einer kürzlich veröffentlichten Studie auf arXiv wird ein innovatives Prüfverfahren vorgestellt, das die Treue von Physics‑Informed Neur…

arXiv – cs.LG 21.01.2026 05:00

Forschung

Neue analytische Bijektionen revolutionieren glatte, interpretierbare Normalisierungsflüsse

Die Entwicklung von Normalisierungsflüssen steht vor einer zentralen Herausforderung: Wie kann man skalare Bijektionen schaffen, die gleich…

arXiv – cs.LG 19.01.2026 05:00

Forschung

Optimale Kontrolle für terminale Constraints in Flow-Modellen

In einer bahnbrechenden Studie wird gezeigt, wie man mit vortrainierten, flow‑basierten Generativmodellen gezielt aus Verteilungen mit term…

arXiv – cs.LG 15.01.2026 05:00

Forschung

Bayessche Kalman-Filter revolutionieren In-Context-Lernen in LLMs

Ein neues arXiv‑Veröffentlichung (2601.06100v1) präsentiert einen theoretisch fundierten Ansatz, der die Anpassung von großen Sprachmodelle…

arXiv – cs.LG 13.01.2026 05:00

Forschung

Baumpräconditionierte differenzierbare Optimierung und Axiome als Schichten

Ein neues Forschungsdokument präsentiert einen differenzierbaren Ansatz, der die axiomatische Struktur von Random Utility Models (RUM) dire…

arXiv – cs.LG 13.01.2026 05:00

Forschung

Neues Framework komprimiert und quantisiert PINNs für Edge-Devices

Physik-Informed Neural Networks (PINNs) haben sich als vielversprechende Methode etabliert, um partielle Differentialgleichungen (PDEs) zu…

arXiv – cs.LG 11.12.2025 05:00

Forschung

Neue Initialisierung verbessert Gradientenkontrolle bei sinusoidalen Netzwerken

Forscher haben eine neue Initialisierungsmethode für neuronale Netzwerke mit sinusoidalen Aktivierungsfunktionen wie SIREN vorgestellt. Die…

arXiv – cs.LG 09.12.2025 05:00

Forschung

Neues Maß für Gedächtnisverbrauch in Reinforcement Learning

In einer kürzlich veröffentlichten Arbeit auf arXiv wird ein neues, modellunabhängiges Messinstrument namens Temporal Range vorgestellt, da…

arXiv – cs.LG 09.12.2025 05:00

Forschung

Ein neues theoretisches Fundament erklärt, wie große Sprachmodelle (LLMs) aus kontinuierlichen Berechnungen strukturierte, symbolische Bedeutungen ableiten. In der kürzlich veröffentlichten Arbeit von ArXiv‑Studien (ArXiv:2512.05162v1) wird das Verhalten von LLMs als „Continuous State Machines“ (CSMs) modelliert – glatte dynamische Systeme, deren latente Zustandsräume sich unter probabilistischen Übergangsoperatoren entwickeln.

Der Kern des Ansatzes ist der Transferoperator $P$, der die Verteilung semantischer „Masse“ über den Zustandsraum überträgt. Unter milden R…

arXiv – cs.AI 08.12.2025 05:00

Forschung

Deceptron: Schnelle und stabile physikalische Inversion durch lernte lokale Inverse

In der Physik stoßen inverse Probleme häufig auf schlecht konditionierte Eingaberaumbedingungen, die die Schrittweite stark beeinflussen. D…

arXiv – cs.LG 27.11.2025 05:00

Forschung

Neues TVM-Modell erzielt Rekord‑FID bei ein- und mehrstufiger Diffusion

In einer kürzlich veröffentlichten Arbeit auf arXiv wird das Konzept des Terminal Velocity Matching (TVM) vorgestellt, das die klassische F…

arXiv – cs.LG 26.11.2025 05:00

Forschung

Neuer Ansatz: Klassifikatoren gegen Lernkuriositäten mit gezielter Jacobian-Regularisierung

Neuer Forschungsbeitrag aus dem arXiv-Repository präsentiert einen innovativen Weg, um das Problem von „Shortcut Learning“ in tiefen neuron…

arXiv – cs.LG 26.11.2025 05:00

Forschung

Neural PDE-Lösungen: Training-freie Projektionen reduzieren Fehler drastisch

Neurale Netzwerke, die partielle Differentialgleichungen (PDEs) lösen, sind in der wissenschaftlichen Simulation zunehmend beliebt. Sie sto…

arXiv – cs.LG 24.11.2025 05:00

Forschung

Neue GNN-Modelle L-JacobiNet und S-JacobiNet zeigen überraschende Stabilitätsvorteile

Die neuesten Erkenntnisse aus der arXiv-Studie 2511.16081v1 beleuchten die Grenzen traditioneller Spectral-GNNs wie ChebyNet, die durch ihr…

arXiv – cs.LG 21.11.2025 05:00

Forschung

Radial Compensation: Stabilisiert generative Modelle auf Riemannschen Mannigfaltigkeiten

In der neuesten Veröffentlichung auf arXiv (2511.14056v1) wird ein bahnbrechender Ansatz vorgestellt, der generative Modelle auf gekrümmten…

arXiv – cs.LG 19.11.2025 05:00

Forschung

SCALAR: Benchmark für Interaktionssparsamkeit von SAE in kleinen LLMs

Mechanistische Interpretierbarkeit zielt darauf ab, neuronale Netze in verständliche Bausteine zu zerlegen und die Verbindungen zwischen ih…

arXiv – cs.LG 12.11.2025 05:00

Forschung

Konformes Lernen sichert autonome Systeme: Ensemble‑Sicherheitsfilter und HJ‑Analyse

Die Sicherheit von lernbasierten autonomen Systemen ist entscheidend, wenn sie in der Praxis eingesetzt werden sollen. Traditionell nutzt m…

arXiv – cs.LG 12.11.2025 05:00

Forschung

Neuer Score misst Unsicherheit in Transformer-Schaltkreisen

In der Mechanistic‑Interpretability-Forschung wurden funktionale Teilgraphen in großen Sprachmodellen – die sogenannten Transformer‑Circuit…

arXiv – cs.LG 10.09.2025 05:00

Forschung

Neues Grad-CAM-Verfahren visualisiert PCA- und SVM-Schichten in CNNs

Convolutional Neural Networks (CNNs) gelten als äußerst leistungsfähig bei Klassifikationsaufgaben, besonders wenn große Datensätze vorlieg…

arXiv – cs.LG 19.08.2025 05:00

Forschung

Gating in RNNs wirkt wie adaptive Lernrate – neue dynamische Einsicht

Forscher haben herausgefunden, dass die Gating‑Mechanismen in rekurrenten neuronalen Netzwerken (RNNs) selbstständig ein adaptives Lernverh…

arXiv – cs.LG 19.08.2025 05:00

Forschung

Kontraktive Regularisierung stärkt Convolutional NODEs gegen Rauschen

Neues arXiv‑Paper (ID 2508.11432v1) zeigt, wie Convolutional Neural Ordinary Differential Equations (NODEs) durch kontraktive Regularisieru…

arXiv – cs.LG 18.08.2025 05:00

Finde Modelle, Firmen und Themen

VINA: Variational Invertible Neural Architectures – Wege im Modellieren

Transformer‑Stabilität: Neue Theorie erklärt Sensitivität und Architektur

Neues analytisches Framework für differenzierbare hydrologische Modelle

GeoIB: Geometrisch fundiertes Information Bottleneck ohne MI-Schätzung

MeanCache beschleunigt Flow-Matching-Modelle um bis zu 4,56× – neue caching-Strategie

Neue Methode enthüllt, welche Tokens LLMs bei Vorhersagen beeinflussen

Neues Verfahren prüft Genauigkeit von PINNs mit Fisher-Information

Neue analytische Bijektionen revolutionieren glatte, interpretierbare Normalisierungsflüsse

Optimale Kontrolle für terminale Constraints in Flow-Modellen

Bayessche Kalman-Filter revolutionieren In-Context-Lernen in LLMs

Baumpräconditionierte differenzierbare Optimierung und Axiome als Schichten

Neues Framework komprimiert und quantisiert PINNs für Edge-Devices

Neue Initialisierung verbessert Gradientenkontrolle bei sinusoidalen Netzwerken

Neues Maß für Gedächtnisverbrauch in Reinforcement Learning

Deceptron: Schnelle und stabile physikalische Inversion durch lernte lokale Inverse

Neues TVM-Modell erzielt Rekord‑FID bei ein- und mehrstufiger Diffusion

Neuer Ansatz: Klassifikatoren gegen Lernkuriositäten mit gezielter Jacobian-Regularisierung

Neural PDE-Lösungen: Training-freie Projektionen reduzieren Fehler drastisch

Neue GNN-Modelle L-JacobiNet und S-JacobiNet zeigen überraschende Stabilitätsvorteile

Radial Compensation: Stabilisiert generative Modelle auf Riemannschen Mannigfaltigkeiten

SCALAR: Benchmark für Interaktionssparsamkeit von SAE in kleinen LLMs

Konformes Lernen sichert autonome Systeme: Ensemble‑Sicherheitsfilter und HJ‑Analyse

Neuer Score misst Unsicherheit in Transformer-Schaltkreisen

Neues Grad-CAM-Verfahren visualisiert PCA- und SVM-Schichten in CNNs

Gating in RNNs wirkt wie adaptive Lernrate – neue dynamische Einsicht

Kontraktive Regularisierung stärkt Convolutional NODEs gegen Rauschen

🍪 Cookie-Einstellungen