Suche nach NFE | meineki.news

Neues System nutzt Kompetenzfragen als Plan für authentische Kulturerzählungen

Die Bewahrung immateriellen Kulturerbes steht vor einer großen Herausforderung: Während große Sprachmodelle (LLMs) fesselnde Geschichten er…

arXiv – cs.AI 06.04.2026 04:00

Forschung

Neues Verfahren verbessert mathematisches Denken von KI-Modellen

In der Welt der großen Sprachmodelle (LLMs) hat sich das mathematische Denken dank Reinforcement Learning (RL) mit überprüfbaren Belohnunge…

arXiv – cs.AI 06.04.2026 04:00

Forschung

WebGPU-Dispatch-Overhead bei LLM-Inferezen:4 GPU-Hersteller, 3 Backends, 3 Browser

Die Sicherheitsarchitektur von WebGPU verlangt bei jeder Operation eine Validierung, die bei den vielen kleinen Dispatches, die bei der Inf…

arXiv – cs.LG 06.04.2026 04:00

Forschung

Schnelle NF4‑Dequantisierung für große Sprachmodelle – 2,2× schnellere Kernel

Moderne Sprachmodelle überschreiten die Speichergrenzen einzelner GPU‑Geräte, sodass Quantisierung unumgänglich wird. Die 4‑Bit‑NormalFloat…

arXiv – cs.LG 06.04.2026 04:00

Forschung

KI formalisiert 500‑Seiten‑Textbuch in Lean – Rekordautomatisierung

Ein automatisiertes KI-System hat ein 500‑Seiten‑langes Lehrbuch der algebraischen Kombinatorik vollständig in das Lean‑Theorem‑Prover‑Syst…

arXiv – cs.AI 06.04.2026 04:00

Forschung

Neuro-Symbolisches Dual-Memory-Framework verbessert Langzeit-LLM-Agenten

Große Sprachmodelle (LLMs) zeigen großes Potenzial bei Aufgaben mit langen Entscheidungswegen, etwa bei physischer Manipulation oder Webint…

arXiv – cs.AI 06.04.2026 04:00

Forschung

Causal-Audit: Risikobewertung von Annahmeverletzungen in Zeitreihen-Kausalität

Ein neues Tool namens Causal-Audit bietet Forschern eine systematische Möglichkeit, die Zuverlässigkeit von Zeitreihen-Kausalitätsmethoden…

arXiv – cs.LG 06.04.2026 04:00

Forschung

UI‑Oceanus: GUI-Agenten skalieren durch synthetische Umweltmodelle

Die neue Methode UI‑Oceanus löst ein langjähriges Problem bei der Skalierung von GUI‑Agenten: die Abhängigkeit von teuren menschlichen Demo…

arXiv – cs.AI 06.04.2026 04:00

Forschung

CIPHER: Phonem-Entschlüsselung aus hochdichtem EEG – ein neuer Benchmark

Mit dem neuen Modell CIPHER (Conformer-based Inference of Phonemes from High-density EEG Representations) wird ein bedeutender Schritt in d…

arXiv – cs.AI 06.04.2026 04:00

Praxis

Erstellung Netflix VOID Pipeline für Video-Objektentfernung mit CogVideoX

In diesem Tutorial wird Schritt für Schritt gezeigt, wie man eine fortschrittliche Pipeline für das Netflix‑VOID‑Modell aufsetzt. Zunächst…

MarkTechPost 05.04.2026 20:19

Forschung

ZEUS beschleunigt Diffusionsmodelle um bis zu 3,2‑fach ohne Architekturänderungen

Denoising‑generative Modelle liefern beeindruckende Bild- und Videokonzepte, bleiben jedoch durch die vielen iterativen Denoiser‑Aufrufe be…

arXiv – cs.LG 03.04.2026 04:00

Forschung

Reward‑Hacking bei LLMs: Neue Erkenntnisse und effektive Gegenmaßnahmen

Reinforcement‑Learning‑Modelle für große Sprachmodelle (LLMs) zeigen ein starkes Risiko des Reward‑Hackings: Sie finden Wege, die Belohnung…

arXiv – cs.LG 03.04.2026 04:00

Forschung

Neuer Actor-Critic-Algorithmus reduziert Rauschen bei TD-Fehlern

In der Verstärkungslern‑Forschung ist der temporale Differenzfehler (TD‑Fehler) ein zentrales Werkzeug zur Optimierung von Wert‑ und Politi…

arXiv – cs.LG 03.04.2026 04:00

Forschung

G-Drift MIA: Neue Methode zur Aufdeckung von Trainingsbeispielen in LLMs

Large Language Models (LLMs) werden mit riesigen Webkorpora trainiert, was immer mehr Bedenken hinsichtlich Privatsphäre und Urheberrecht a…

arXiv – cs.LG 02.04.2026 04:00

Forschung

GPU-gestützte, exakt skalierbare Inferenz für Hawkes-Prozesse

Hawkes-Prozesse sind selbstverstärkende Punktprozesse, die in Bereichen wie Finanzmarktanalyse, Netzwerkanalyse und seismologischer Vorhers…

arXiv – cs.LG 03.04.2026 04:00

Forschung

Testzeit-Skalierung macht Übertraining rechnerisch optimal Eine neue Studie aus dem arXiv-Repository zeigt, dass die Art und Weise, wie moderne Sprachmodelle bei der Inferenz skaliert werden, die optimale Trainingsstrategie grundlegend verändert. Während bisherige Skalierungsformeln wie Chinchilla nur die Kosten des Pretrainings berücksichtigen, beleuchtet die Arbeit die zusätzlichen Ausgaben, die durch wiederholtes Sampling während der Testphase entstehen. Bei Testzeit-Skalierung wird die

arXiv – cs.LG 03.04.2026 04:00

Forschung

Neuer Graph Neural Operator Echtzeit-Virtual-Sensing auf unregelmäßigen Netzen

Forscher haben einen bahnbrechenden Graph Neural Operator namens VIRSO (Virtual Irregular Real‑Time Sparse Operator) vorgestellt, der die E…

arXiv – cs.LG 03.04.2026 04:00

Forschung

Neues Framework für Long‑Tailed Reranking: Residual Decomposition

In der Long‑Tailed‑Klassifikation, bei der wenige häufige Klassen die Mehrheit der seltenen Klassen dominieren, neigen Modelle dazu, bei de…

arXiv – cs.LG 03.04.2026 04:00

Forschung

CircuitProbe: Schnelle Vorhersage von Rechenkreisen in Transformer-Modellen

Transformer‑Sprachmodelle enthalten spezialisierte Rechenkreise, die in aufeinanderfolgenden Layer‑Blöcken liegen und die Leistung beim Dup…

arXiv – cs.AI 02.04.2026 04:00

Forschung

Reinforcement Learning steigert Chemie-Integration um 3×

In einer kürzlich veröffentlichten Arbeit auf arXiv (2604.00264v1) stellen Wissenschaftler ein neues, reinforcement‑learning‑basiertes Syst…

arXiv – cs.LG 02.04.2026 04:00

Forschung

SAGE: KI-gestützte Geostatistik für Velocity‑Modelle aus begrenzten Daten

Mit dem neuen Framework SAGE wird die Synthese von subsurface Velocity‑Modellen durch generative Netzwerke revolutioniert. Statt der herköm…

arXiv – cs.LG 02.04.2026 04:00

Forschung

LLM-Infere Scheduling: Unsicherheitsbewusste Ausgabe-Längenvorhersagen

In der Welt der großen Sprachmodelle (LLMs) ist die effiziente Planung von Inferenzaufgaben entscheidend. Traditionell nutzt man das Prinzi…

arXiv – cs.LG 02.04.2026 04:00

Forschung

Neues GNN-Framework: Cross‑graph Prompting ohne Feinabstimmung

Ein neues Forschungsprojekt hat ein völlig neues Konzept für Graph Neural Networks (GNNs) vorgestellt, das die bisherige Notwendigkeit umfa…

arXiv – cs.LG 02.04.2026 04:00

Praxis

Gemma 3 1B Instruct: Produktionsreife KI‑Pipeline mit Hugging Face & Colab

In diesem Tutorial zeigen wir, wie man eine vollständig reproduzierbare Colab‑Pipeline für das Gemma 3 1B Instruct-Modell aufbaut und ausfü…

MarkTechPost 01.04.2026 16:59

Forschung

Neues Modell verbessert Vorhersage von Hurrikankurzflucht weltweit

Die genaue Vorhersage von Fluchtentscheidungen bei Hurrikanen ist entscheidend für die Katastrophenvorsorge. Traditionelle Modelle, die in…

arXiv – cs.LG 02.04.2026 04:00

Forschung

Neues generatives Framework DB-GEN verbessert dynamische Multi-Objektivoptimierung

Die dynamische Multi-Objektivoptimierung erfordert die kontinuierliche Verfolgung sich verändernder Pareto-Grenzen. Traditionelle Ansätze k…

arXiv – cs.LG 02.04.2026 04:00

Forschung

ReproMIA: Neue Methode für effiziente Membership‑Inference‑Angriffe

In einer Zeit, in der Deep‑Learning‑Modelle immer stärker in kritischen Bereichen eingesetzt werden, wächst die Sorge um die Privatsphäre…

arXiv – cs.LG 01.04.2026 04:00

Forschung

MAC-Attention: Schnellere und genaue Attention‑Berechnung für lange Kontexte

In der Welt der großen Sprachmodelle (LLMs) ist die Verarbeitung langer Kontexte oft durch I/O‑Bottlenecks begrenzt: jedes neue Token muss…

arXiv – cs.LG 02.04.2026 04:00

Forschung

Multi-Format Quantization-Aware Training für elastische Inferenz

Quantisierung‑bewusstes Training (QAT) wird üblicherweise für ein einziges numerisches Format durchgeführt, obwohl reale Systeme oft die Pr…

arXiv – cs.LG 02.04.2026 04:00

Forschung

Neues Verfahren zur Erkennung von Out-of-Distribution-Beispielen in Graphen

In vielen praktischen Anwendungen treffen Trainings- und Testdaten auf unterschiedliche Verteilungen, was tiefen neuronalen Netzwerken (DNN…

arXiv – cs.LG 01.04.2026 04:00

Finde Modelle, Firmen und Themen

Neues System nutzt Kompetenzfragen als Plan für authentische Kulturerzählungen

Neues Verfahren verbessert mathematisches Denken von KI-Modellen

WebGPU-Dispatch-Overhead bei LLM-Inferezen:4 GPU-Hersteller, 3 Backends, 3 Browser

Schnelle NF4‑Dequantisierung für große Sprachmodelle – 2,2× schnellere Kernel

KI formalisiert 500‑Seiten‑Textbuch in Lean – Rekordautomatisierung

Neuro-Symbolisches Dual-Memory-Framework verbessert Langzeit-LLM-Agenten

Causal-Audit: Risikobewertung von Annahmeverletzungen in Zeitreihen-Kausalität

UI‑Oceanus: GUI-Agenten skalieren durch synthetische Umweltmodelle

CIPHER: Phonem-Entschlüsselung aus hochdichtem EEG – ein neuer Benchmark

Erstellung Netflix VOID Pipeline für Video-Objektentfernung mit CogVideoX

ZEUS beschleunigt Diffusionsmodelle um bis zu 3,2‑fach ohne Architekturänderungen

Reward‑Hacking bei LLMs: Neue Erkenntnisse und effektive Gegenmaßnahmen

Neuer Actor-Critic-Algorithmus reduziert Rauschen bei TD-Fehlern

G-Drift MIA: Neue Methode zur Aufdeckung von Trainingsbeispielen in LLMs

GPU-gestützte, exakt skalierbare Inferenz für Hawkes-Prozesse

Neuer Graph Neural Operator Echtzeit-Virtual-Sensing auf unregelmäßigen Netzen

Neues Framework für Long‑Tailed Reranking: Residual Decomposition

CircuitProbe: Schnelle Vorhersage von Rechenkreisen in Transformer-Modellen

Reinforcement Learning steigert Chemie-Integration um 3×

SAGE: KI-gestützte Geostatistik für Velocity‑Modelle aus begrenzten Daten

LLM-Infere Scheduling: Unsicherheitsbewusste Ausgabe-Längenvorhersagen

Neues GNN-Framework: Cross‑graph Prompting ohne Feinabstimmung

Gemma 3 1B Instruct: Produktionsreife KI‑Pipeline mit Hugging Face & Colab

Neues Modell verbessert Vorhersage von Hurrikankurzflucht weltweit

Neues generatives Framework DB-GEN verbessert dynamische Multi-Objektivoptimierung

ReproMIA: Neue Methode für effiziente Membership‑Inference‑Angriffe

MAC-Attention: Schnellere und genaue Attention‑Berechnung für lange Kontexte

Multi-Format Quantization-Aware Training für elastische Inferenz

Neues Verfahren zur Erkennung von Out-of-Distribution-Beispielen in Graphen

🍪 Cookie-Einstellungen

Gemma 3 1B Instruct: Produktionsreife KI‑Pipeline mit Hugging Face & Colab