Suche nach Aktivierungsfunktion

Kontrollierbare Exploration in Hybrid-Policy RLVR für multimodale Logik

Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) hat sich als zentrales Lernparadigma etabliert, um die Denkfähigkeiten multim…

arXiv – cs.LG 25.02.2026 05:00

Forschung

Hyperbolische Busemann-Neuronale Netzwerke

Eine neue Klasse von neuronalen Netzwerken, die auf hyperbolischen Räumen operieren, wurde auf arXiv veröffentlicht (ID 2602.18858v1). Hype…

arXiv – cs.LG 24.02.2026 05:00

Forschung

Rationale Aktivierungen: Mehr Ausdruckskraft und Effizienz in neuronalen Netzen

Neuer Forschungsschwerpunkt: Neuronale Netze, die mit lernbaren, niedriggradigen rationalen Aktivierungsfunktionen arbeiten, zeigen deutlic…

arXiv – cs.AI 16.02.2026 05:00

Forschung

Neuralnetze mit zwei Schichten: Geometrische Trennung & universelle Approximation

Ein neues arXiv‑Veröffentlichung (2602.12482v1) präsentiert eine elegante geometrische Konstruktion von neuronalen Netzen, die disjunkte ko…

arXiv – cs.LG 16.02.2026 05:00

Forschung

GAC‑KAN: Ultra‑leichter GNSS‑Störklassifikator für GenAI‑basierte Edge‑Geräte

Die Integration von Generative‑AI (GenAI) in Konsumelektronik – von KI‑gestützten Assistenten in Wearables bis hin zu generativer Planung i…

arXiv – cs.LG 13.02.2026 05:00

Forschung

MeCSAFNet: Bis zu 19 % bessere multispektrale Segmentierung

Ein neues Deep‑Learning‑Modell namens MeCSAFNet hat die Leistung bei der Land‑Cover‑Segmentierung in multispektralen Bildern deutlich verbe…

arXiv – cs.AI 12.02.2026 05:00

Forschung

EUGens: Effiziente, einheitliche und vielseitige Dichte‑Schichten für KI

Effizienz ist das Herzstück moderner KI‑Modelle, besonders wenn sie in Echtzeit‑Anwendungen oder ressourcenbeschränkten Umgebungen eingeset…

arXiv – cs.AI 09.02.2026 05:00

Forschung

TruKAN: Effizientere Kolmogorov-Arnold-Netze mit Potenzfunktionen

In einer neuen Veröffentlichung auf arXiv präsentiert das Forschungsteam die Architektur TruKAN, die die klassische Kolmogorov-Arnold-Netzw…

arXiv – cs.AI 05.02.2026 05:00

Forschung

Neues HaKAN-Modell übertrifft Transformer bei Zeitreihenprognosen

In einer kürzlich veröffentlichten Arbeit auf arXiv präsentiert ein Forschungsteam ein innovatives Modell namens HaKAN, das die Grenzen her…

arXiv – cs.LG 28.01.2026 05:00

Forschung

N-Way Self-Evaluating Deliberation: Neue Architektur vereint heterogene Agenten

Das N-Way Self-Evaluating Deliberation (NSED) ist ein neues Runtime Mixture-of-Models (MoM)-Protokoll, das aus einer Vielzahl unterschiedli…

arXiv – cs.AI 26.01.2026 05:00

Forschung

Brownian ReLU: Neue Aktivierungsfunktion verbessert LSTM bei Finanzdaten

In der Welt des Deep Learning stoßen herkömmliche Aktivierungsfunktionen wie ReLU, LeakyReLU und PReLU häufig auf Gradientinstabilitäten, w…

arXiv – cs.LG 26.01.2026 05:00

Forschung

Genauere Unsicherheitsanalyse: Exakte Ergebnisse für MLPs mit ReLU

Eine neue Veröffentlichung auf arXiv liefert exakte analytische Formeln für die Unsicherheitsweitergabe in trainierten Multi‑Layer‑Perzeptr…

arXiv – cs.LG 26.01.2026 05:00

Forschung

Poisson‑Hyperflächenprozesse revolutionieren ReLU‑Netzwerke

Neural‑Netzwerke haben in den letzten Jahren bahnbrechende Erfolge in Klassifikations‑ und Regressionsaufgaben erzielt. Besonders die Recti…

arXiv – cs.LG 12.01.2026 05:00

Forschung

ReLU versagt in physik‑informierten Lernmodellen – Warum?<br/>

In der physik‑informierten KI werden neuronale Netze mithilfe von gewöhnlichen und partiellen Differentialgleichungen trainiert, um Lösungs…

arXiv – cs.LG 15.12.2025 05:00

Forschung

Neues physikbasiertes neuronales Netzwerk löst Inverse-Scattering-Probleme

Ein neues Forschungsprojekt hat ein verbessertes physikgetriebenes neuronales Netzwerk (IPDNN) vorgestellt, das inverse Streuungsprobleme i…

arXiv – cs.LG 11.12.2025 05:00

Forschung

Softly Symbolified KANs: Interpretable ML mit sparsamer Symbolik

Auf der Plattform arXiv wurde ein neues Papier veröffentlicht, das die Kolmogorov‑Arnold‑Netzwerke (KANs) um ein innovatives Konzept erweit…

arXiv – cs.LG 10.12.2025 05:00

Forschung

Neue Initialisierung verbessert Gradientenkontrolle bei sinusoidalen Netzwerken

Forscher haben eine neue Initialisierungsmethode für neuronale Netzwerke mit sinusoidalen Aktivierungsfunktionen wie SIREN vorgestellt. Die…

arXiv – cs.LG 09.12.2025 05:00

Forschung

Neues Forschungsprojekt untersucht Aktivierungsfunktionen und Nicht‑IID‑Daten für robuste ML‑Modelle

In einer aktuellen Studie von Forschern aus dem Bereich der künstlichen Intelligenz wurde die Robustheit von maschinellen Lernmodellen syst…

arXiv – cs.LG 05.12.2025 05:00

Forschung

Memory-DD: Neuer, einfacher Neuronentyp für zeitliche Vorhersagen

In einer kürzlich veröffentlichten Studie auf arXiv wird Memory-DD vorgestellt – ein neuronales Modell, das die Vorteile dendritischer Stru…

arXiv – cs.AI 05.12.2025 05:00

Forschung

Neuer Transformer löst Wärmeleitungsprobleme an Chip-Substrat-Grenzen

In modernen Halbleitergeräten bestimmt die Wärmeabfuhr von der Chip‑Substrat‑Verbindung den thermischen Betrieb. Dort entsteht bei der Über…

arXiv – cs.LG 03.12.2025 05:00

Forschung

ScoresActivation: Aktivierungsfunktion für globale Erklärbarkeit <p>Ein neues Verfahren namens ScoresActivation eröffnet einen Weg, die Erklärbarkeit von Deep‑Learning‑Modellen direkt in den Trainingsprozess einzubinden. Statt auf nachträgliche Analysewerkzeuge zurückzugreifen, nutzt die Methode eine differenzierbare Aktivierungsfunktion, die Feature‑Wichtigkeit während des Lernens bewertet.</p> <p>Die ScoresActivation‑Funktion fungiert als Feature‑Ranking‑Mechanismus, der in die Lernpipeline integriert

arXiv – cs.LG 19.11.2025 05:00

Forschung

N-ReLU: Stochastische Erweiterung von ReLU ohne tote Neuronen

Aktivierungsfunktionen sind das Herzstück von Deep‑Learning‑Modellen, denn sie ermöglichen nichtlineare Darstellungen. Die weit verbreitete…

arXiv – cs.LG 12.11.2025 05:00

Forschung

Neues arXiv: Zusammenhang von Aktivierungs- und Verlustfunktionen

Eine aktuelle Veröffentlichung auf arXiv (2511.05131v1) beleuchtet, wie die Wahl der Aktivierungsfunktion im Ausgangsschicht eines neuronal…

arXiv – cs.LG 10.11.2025 05:00

Forschung

Stochastischer Gauss-Newton-Optimierer zeigt neue Generalisierungsgrenzen

In einer aktuellen Veröffentlichung auf arXiv wird ein stochastischer Gauss-Newton-Algorithmus (SGN) vorgestellt, der mit Levenberg–Marquar…

arXiv – cs.LG 07.11.2025 05:00

Forschung

Taguchi-Optimierung steigert CNN-Leistung bei Box-Action-Erkennung

In einer neuen Studie wird die Taguchi-Design-of-Experiments-Methode auf Convolutional Neural Networks (CNNs) angewandt, um die Hyperparame…

arXiv – cs.LG 01.10.2025 05:00

Praxis

Der Perzeptron: Ursprung des maschinellen Lernens

Die Geschichte des maschinellen Lernens beginnt mit einem einfachen, aber revolutionären Konzept: dem Perzeptron. Dieses Modell, entwickelt…

Ben Recht – Argmin 23.09.2025 14:59

Forschung

Neural Networks: Linear Regions und Skip Connections – Neue Erkenntnisse

Neural‑Netzwerke sind zentrale Werkzeuge im maschinellen Lernen. Durch die Darstellung von stückweise linearen Aktivierungsfunktionen mitte…

arXiv – cs.LG 22.09.2025 05:00

Forschung

Stochastische Gradientenverfahren zeigen lineare Konvergenz bei breiten PINNs

In einer neuen Veröffentlichung auf arXiv wird gezeigt, dass stochastische Gradientenverfahren – die in der Praxis häufig zum Trainieren vo…

arXiv – cs.LG 01.09.2025 05:00

Forschung

Neuer Ansatz mit neuronalen Netzwerken liefert exakte Lösungen für nichtlineare PDEs

In einer aktuellen Veröffentlichung auf arXiv wird das Auxiliary Equation Neural Networks Method (AENNM) vorgestellt – ein innovatives Verf…

arXiv – cs.LG 26.08.2025 05:00

Forschung

Kontraktive Regularisierung stärkt Convolutional NODEs gegen Rauschen

Neues arXiv‑Paper (ID 2508.11432v1) zeigt, wie Convolutional Neural Ordinary Differential Equations (NODEs) durch kontraktive Regularisieru…

arXiv – cs.LG 18.08.2025 05:00

Finde Modelle, Firmen und Themen

Kontrollierbare Exploration in Hybrid-Policy RLVR für multimodale Logik

Hyperbolische Busemann-Neuronale Netzwerke

Rationale Aktivierungen: Mehr Ausdruckskraft und Effizienz in neuronalen Netzen

Neuralnetze mit zwei Schichten: Geometrische Trennung & universelle Approximation

GAC‑KAN: Ultra‑leichter GNSS‑Störklassifikator für GenAI‑basierte Edge‑Geräte

MeCSAFNet: Bis zu 19 % bessere multispektrale Segmentierung

EUGens: Effiziente, einheitliche und vielseitige Dichte‑Schichten für KI

TruKAN: Effizientere Kolmogorov-Arnold-Netze mit Potenzfunktionen

Neues HaKAN-Modell übertrifft Transformer bei Zeitreihenprognosen

N-Way Self-Evaluating Deliberation: Neue Architektur vereint heterogene Agenten

Brownian ReLU: Neue Aktivierungsfunktion verbessert LSTM bei Finanzdaten

Genauere Unsicherheitsanalyse: Exakte Ergebnisse für MLPs mit ReLU

Poisson‑Hyperflächenprozesse revolutionieren ReLU‑Netzwerke

ReLU versagt in physik‑informierten Lernmodellen – Warum?<br/>

Neues physikbasiertes neuronales Netzwerk löst Inverse-Scattering-Probleme

Softly Symbolified KANs: Interpretable ML mit sparsamer Symbolik

Neue Initialisierung verbessert Gradientenkontrolle bei sinusoidalen Netzwerken

Neues Forschungsprojekt untersucht Aktivierungsfunktionen und Nicht‑IID‑Daten für robuste ML‑Modelle

Memory-DD: Neuer, einfacher Neuronentyp für zeitliche Vorhersagen

Neuer Transformer löst Wärmeleitungsprobleme an Chip-Substrat-Grenzen

N-ReLU: Stochastische Erweiterung von ReLU ohne tote Neuronen

Neues arXiv: Zusammenhang von Aktivierungs- und Verlustfunktionen

Stochastischer Gauss-Newton-Optimierer zeigt neue Generalisierungsgrenzen

Taguchi-Optimierung steigert CNN-Leistung bei Box-Action-Erkennung

Der Perzeptron: Ursprung des maschinellen Lernens

Neural Networks: Linear Regions und Skip Connections – Neue Erkenntnisse

Stochastische Gradientenverfahren zeigen lineare Konvergenz bei breiten PINNs

Neuer Ansatz mit neuronalen Netzwerken liefert exakte Lösungen für nichtlineare PDEs

Kontraktive Regularisierung stärkt Convolutional NODEs gegen Rauschen

🍪 Cookie-Einstellungen

MeCSAFNet: Bis zu 19 % bessere multispektrale Segmentierung