Suche nach Matrix | meineki.news

Transformer-MLPs: Hälfte der Nichtlinearität verschwendet – spart Rechenleistung

Eine neue Studie auf arXiv zeigt, dass bei Transformer‑Modellen bis zu die Hälfte der nichtlinearen Berechnungen im MLP‑Block unnötig ist…

arXiv – cs.LG 05.03.2026 05:00

Forschung

Tiefe Netzwerke fördern Low‑Rank‑Bias bei Matrix Completion – neue Erkenntnisse

In einer kürzlich veröffentlichten Arbeit wird Matrix Completion mithilfe von tiefen Matrix‑Faktorisierungen – also tiefen linearen neurona…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Neuer Graph-Transformer revolutioniert Vorhersage von Wellenfunktionen in TDDFT

In der Echtzeit‑TDDFT (zeitabhängige Dichtefunktionaltheorie) werden die elektronischen Wellenfunktionen eines Moleküls kontinuierlich in R…

arXiv – cs.LG 05.03.2026 05:00

Forschung

Neues Riemannian-Optimierungsverfahren verbessert modulare Systeme

Ein neues arXiv‑Veröffentlichung (2603.03610v1) liefert einen bedeutenden Fortschritt in der Optimierung von Systemen, die aus modularen Ba…

arXiv – cs.LG 05.03.2026 05:00

Forschung

Preconditioning verbessert Flow-Matching-Training durch bessere Konditionierung

Ein neues Papier auf arXiv beleuchtet, wie die Geometrie der Zwischendichten in Flow‑Matching‑ und score‑basierten Diffusionsmodellen die O…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Temperaturparameter in Knowledge Distillation beleuchtet – klare Auswahlrichtlinien

In der Wissensdistillation wird ein Temperaturparameter eingesetzt, um die in den Gewichten des Lehrmodells verborgene Beziehungsmatrix für…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Neues Verfahren verbessert automatisierte Bewertung mit LLMs

In der automatisierten Bewertung von Texten mit großen Sprachmodellen (LLMs) ist die Erstellung präziser Bewertungsrichtlinien entscheidend…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Certainty-Validity: Diagnose-Framework für diskrete Commitment-Systeme

Standardmetriken wie Genauigkeit, Präzision, Recall und AUROC gehen davon aus, dass alle Fehler gleich schwerwiegend sind – ein sicher fals…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Skalierbares GP-Framework für parametrische Raum‑Zeit‑Felder

In einer kürzlich veröffentlichten Studie haben Forscher ein neues, skalierbares Gaussian‑Process‑Framework vorgestellt, das parametrische…

arXiv – cs.LG 03.03.2026 05:00

Forschung

GRAIL: Post-hoc Linear-Reconstruction kompensiert Kompression von Deep Networks

GRAIL ist ein neuer Ansatz, der die Genauigkeitsverluste nach aggressiver Kompression von tiefen neuronalen Netzen adressiert. Der Ansatz n…

arXiv – cs.LG 02.03.2026 05:00

Praxis

Google AI präsentiert STATIC: 948‑fach schnellere LLM‑basierte Generative Retrieval

Google AI hat mit dem neuen Framework STATIC einen Meilenstein im Bereich der generativen Retrieval‑Technologien gesetzt. Durch die Nutzung…

MarkTechPost 01.03.2026 21:47

Forschung

REFINE: Vorverarbeitung macht psychiatrische Fragebögen interpretierbar

Psychiatrische Fragebögen sind stark kontextabhängig und liefern oft nur schwache Vorhersagen für das spätere Symptomaufkommen. Das erschwe…

arXiv – cs.LG 02.03.2026 05:00

Forschung

Neue Spektrale Analyse von Sprachmodellen mit Random Matrix Theory

Eine neue Arbeit aus dem arXiv-Repository präsentiert einen einheitlichen Ansatz, um die beiden größten Herausforderungen moderner Deep‑Lea…

arXiv – cs.LG 27.02.2026 05:00

Forschung

Neues FIRE-Benchmark prüft Finanzwissen und Praxisfähigkeit von LLMs

Ein neues, umfassendes Benchmark namens FIRE wurde vorgestellt, das die finanzielle Intelligenz und das Problemlösungsvermögen von großen S…

arXiv – cs.AI 27.02.2026 05:00

Forschung

Titel: Die Auswirkungen des Klimawandels auf die globale Ernährungssicherheit Einleitung: Der Klimawandel ist ein drängendes globales Problem, das weitreichende Konsequenzen für verschiedene Aspekte des menschlichen Lebens hat, einschließlich der Ernährungssicherheit. Die zunehmende Häufigkeit und Intensität extremer Wetterereignisse wie Dürren, Überschwemmungen und Hitzewellen stellen erhebliche Herausforderungen für die landwirtschaftliche Produktion und die weltweite Verfügbarkeit von Lebensmi

arXiv – cs.LG 27.02.2026 05:00

Forschung

Neue Methode: Persistente NMF mit Multi‑Skalen Graph-Regularisierung

Wissenschaftler haben eine neue Variante der Nichtnegativen Matrixfaktorisierung (NMF) vorgestellt, die das Problem der einseitigen, ein‑Sk…

arXiv – cs.LG 27.02.2026 05:00

Forschung

Interleaved Head Attention: Mehr Kommunikation zwischen Attention‑Köpfen

Die Multi‑Head Attention (MHA) bildet das Herz moderner Large Language Models, doch ihre lineare Skalierung birgt ein Problem: Jeder der H…

arXiv – cs.LG 26.02.2026 05:00

Produkt

vLLM: Dutzende feinabgestimmte Modelle effizient auf SageMaker AI & Bedrock bereitstellen

Amazon SageMaker AI und Bedrock nutzen vLLM, um gleichzeitig mehrere feinabgestimmte Modelle zu betreiben. In diesem Beitrag wird erklärt…

AWS – Machine Learning Blog 25.02.2026 20:56

Forschung

LLM als wissenschaftlicher Co‑Pilot: ChatGPT löst komplexe Spektraltheorie

Large Language Models (LLMs) werden immer häufiger als wissenschaftliche Co‑Piloten eingesetzt, doch bisher gibt es nur wenige Belege dafür…

arXiv – cs.AI 24.02.2026 05:00

Forschung

ESM: Revolutionäres Modell-Merging ohne Interferenz

In der KI-Welt steht das Zusammenführen mehrerer, auf spezifische Aufgaben abgestimmter Modelle – ohne zusätzliche Trainingsschritte – seit…

arXiv – cs.LG 25.02.2026 05:00

Forschung

Rank-basierte Spektralgrenzen sichern stabile FP8-Transformer-Training

Ein neues arXiv-Papier liefert einen entscheidenden Fortschritt für das Training von Transformer‑Modellen in extrem niedriger Präzision. Du…

arXiv – cs.LG 24.02.2026 05:00

Forschung

Transformer‑Stabilität: Neue Theorie erklärt Sensitivität und Architektur

In einer bahnbrechenden Studie wird die bislang rätselhafte Zerbrechlichkeit von Transformer‑Modellen endlich entschlüsselt. Die Autoren pr…

arXiv – cs.LG 24.02.2026 05:00

Forschung

Bayessche Stiefel-Adapter: Kalibrierte PEFT für zuverlässige Sprachmodelle

Parameter‑effizientes Fine‑Tuning wie LoRA ermöglicht die praktische Anpassung großer Sprachmodelle, liefert jedoch keine verlässlichen Uns…

arXiv – cs.LG 23.02.2026 05:00

Forschung

Magnetische Phasen‑Konsistenz revolutioniert unsupervised Multi‑View Clustering

Unsupervised Multi‑View Clustering (MVC) versucht, Daten in sinnvolle Gruppen zu zerlegen, indem es die komplementären Informationen mehrer…

arXiv – cs.LG 24.02.2026 05:00

Forschung

Mehrfach-Grokking: Geometrische Entdeckungen in Transformers

In einer brandneuen Studie auf arXiv wird das Phänomen des Grokking – die plötzliche Übergang von bloßem Auswendiglernen zu echter Generali…

arXiv – cs.LG 24.02.2026 05:00

Forschung

GrMoE: Neue Routing‑Methode für Mixture‑of‑Experts mit kontrollierter Sparsität

Mixture‑of‑Experts‑Modelle setzen auf Router, um Tokens an Experten zu verteilen. Die gängige Softmax‑Gating‑Methode bietet jedoch keine kl…

arXiv – cs.LG 23.02.2026 05:00

Forschung

FLoRG: Federiertes Feintuning mit Low‑Rank‑Gram‑Matrizen und Procrustes‑Alignment

Parameter‑effiziente Feintuning‑Methoden wie Low‑Rank‑Adaptation (LoRA) ermöglichen es großen Sprachmodellen, sich schnell an neue Aufgaben…

arXiv – cs.LG 20.02.2026 05:00

Forschung

LLMs und GraphRAG automatisieren DSM‑Erstellung für Cyber‑Physical Systems

Forscher haben gezeigt, dass große Sprachmodelle (LLMs) in Kombination mit Retrieval‑Augmented Generation (RAG) und der graphbasierten Vari…

arXiv – cs.AI 20.02.2026 05:00

Forschung

MeGU: Maschinelles Unlernen mit gezielter Feature‑Entkoppelung

Der Schutz von Trainingsdaten hat das „Recht auf Vergessen“ zu einer zentralen Anforderung gemacht. Gleichzeitig wächst die Nachfrage nach…

arXiv – cs.LG 20.02.2026 05:00

Forschung

Neues Framework zeigt, wie Lokalität in skalierbarem MARL funktioniert

In der Forschung zu skalierbarem Multi-Agenten‑Reinforcement Learning (MARL) stellt die Dimensionenfluch ein zentrales Hindernis dar. Ein b…

arXiv – cs.LG 20.02.2026 05:00

Finde Modelle, Firmen und Themen

Transformer-MLPs: Hälfte der Nichtlinearität verschwendet – spart Rechenleistung

Tiefe Netzwerke fördern Low‑Rank‑Bias bei Matrix Completion – neue Erkenntnisse

Neuer Graph-Transformer revolutioniert Vorhersage von Wellenfunktionen in TDDFT

Neues Riemannian-Optimierungsverfahren verbessert modulare Systeme

Preconditioning verbessert Flow-Matching-Training durch bessere Konditionierung

Temperaturparameter in Knowledge Distillation beleuchtet – klare Auswahlrichtlinien

Neues Verfahren verbessert automatisierte Bewertung mit LLMs

Certainty-Validity: Diagnose-Framework für diskrete Commitment-Systeme

Skalierbares GP-Framework für parametrische Raum‑Zeit‑Felder

GRAIL: Post-hoc Linear-Reconstruction kompensiert Kompression von Deep Networks

Google AI präsentiert STATIC: 948‑fach schnellere LLM‑basierte Generative Retrieval

REFINE: Vorverarbeitung macht psychiatrische Fragebögen interpretierbar

Neue Spektrale Analyse von Sprachmodellen mit Random Matrix Theory

Neues FIRE-Benchmark prüft Finanzwissen und Praxisfähigkeit von LLMs

Neue Methode: Persistente NMF mit Multi‑Skalen Graph-Regularisierung

Interleaved Head Attention: Mehr Kommunikation zwischen Attention‑Köpfen

vLLM: Dutzende feinabgestimmte Modelle effizient auf SageMaker AI & Bedrock bereitstellen

LLM als wissenschaftlicher Co‑Pilot: ChatGPT löst komplexe Spektraltheorie

ESM: Revolutionäres Modell-Merging ohne Interferenz

Rank-basierte Spektralgrenzen sichern stabile FP8-Transformer-Training

Transformer‑Stabilität: Neue Theorie erklärt Sensitivität und Architektur

Bayessche Stiefel-Adapter: Kalibrierte PEFT für zuverlässige Sprachmodelle

Magnetische Phasen‑Konsistenz revolutioniert unsupervised Multi‑View Clustering

Mehrfach-Grokking: Geometrische Entdeckungen in Transformers

GrMoE: Neue Routing‑Methode für Mixture‑of‑Experts mit kontrollierter Sparsität

FLoRG: Federiertes Feintuning mit Low‑Rank‑Gram‑Matrizen und Procrustes‑Alignment

LLMs und GraphRAG automatisieren DSM‑Erstellung für Cyber‑Physical Systems

MeGU: Maschinelles Unlernen mit gezielter Feature‑Entkoppelung

Neues Framework zeigt, wie Lokalität in skalierbarem MARL funktioniert

🍪 Cookie-Einstellungen