Suche nach Speicherressourcen

QTALE: Token‑basierte Layer-Ausführung kombiniert mit Quantisierung – Effiziente LLMs

Große Sprachmodelle (LLMs) erfordern enorme Rechen- und Speicherressourcen, was ihre effiziente Nutzung erschwert. Zwei vielversprechende A…

arXiv – cs.LG 12.02.2026 05:00

Forschung

DP-$\lambda$CGD: Effiziente Rauschkorrelation für privates Modelltraining

Ein neuer Ansatz namens DP-$\lambda$CGD verspricht, die Genauigkeit von Differentially Private Stochastic Gradient Descent (DP‑SGD) zu erhö…

arXiv – cs.LG 02.02.2026 05:00

Forschung

LLMs unter Soft-Error-Test: Erste Analyse der GPU-Ausfallanfälligkeit

Large Language Models (LLMs) erfordern enorme Rechen- und Speicherressourcen, was moderne Hochleistungs-GPUs stark belastet. Gleichzeitig m…

arXiv – cs.AI 29.01.2026 05:00

Forschung

CollectiveKV: Nutzerübergreifende KV-Caches für schnellere Empfehlungssysteme

In der Welt der sequentiellen Empfehlungssysteme ist Geschwindigkeit entscheidend. Transformer‑basierte Modelle liefern zwar exzellente Erg…

arXiv – cs.AI 28.01.2026 05:00

Praxis

KV‑Caching: So beschleunigen Sie LLM‑Inferenz in der Produktion

Wenn Sie ein großes Sprachmodell (LLM) in einer Produktionsumgebung einsetzen, bemerken Sie oft, dass die ersten Token schnell generiert we…

MarkTechPost 21.12.2025 09:23

Forschung

<h1>HGC-Herd: Effiziente Graphenkondensation für heterogene Netzwerke</h1> <p>Heterogene Graph Neural Networks (HGNNs) haben sich als äußerst leistungsfähig bei der Modellierung komplexer Semantik in Netzwerken mit unterschiedlichen Knotentypen und Relationen erwiesen. Ihre Skalierbarkeit auf große Graphen bleibt jedoch ein Problem, weil strukturelle Redundanz und hochdimensionale Knoteneigenschaften enorme Rechen- und Speicherressourcen erfordern.</p> <p>Der neue Ansatz <strong>HGC-Herd</strong> löst diese

arXiv – cs.LG 12.12.2025 05:00

Forschung

Neue probabilistische Lastvorhersage: M2OE2-GL skaliert für tausende Kunden

Probabilistische Lastvorhersagen sind das Herzstück der Planung, des Betriebs und der risikobewussten Entscheidungen in Stromnetzen. Durch…

arXiv – cs.LG 25.11.2025 05:00

Forschung

KRAL: KI-gestützte Antimicrobial‑Therapie mit verbessertem Wissen und Denken

Die klinische Antimicrobial‑Therapie erfordert die dynamische Integration von Pathogenprofilen, Hostfaktoren, pharmakologischen Eigenschaft…

arXiv – cs.AI 21.11.2025 05:00

Forschung

MoE‑SpeQ: Spekulatives Quantisierung‑Decoding mit proaktivem Expert‑Prefetching

Die neuesten Mixture‑of‑Experts‑Modelle fordern enorme Speicherressourcen, die oft die Kapazität eines einzelnen Beschleunigers sprengen. T…

arXiv – cs.LG 19.11.2025 05:00

Forschung

GEM+ setzt neue Maßstäbe: Skalierbare, datenschutzkonforme synthetische Daten

In der Welt der datenschutzkonformen synthetischen Daten hat GEM+ einen bedeutenden Fortschritt erzielt. Durch die Kombination des adaptive…

arXiv – cs.LG 14.11.2025 05:00

Forschung

Transformer mit spektralen Filtern: 10 % bessere Vorhersagen bei Zeitreihen

Transformer‑basierte Modelle dominieren derzeit die Vorhersage langer Zeitreihen, doch sie neigen dazu, sich auf niedrige Frequenzen zu kon…

arXiv – cs.AI 29.08.2025 05:00

Aktuell

NVIDIA löst Engpass in KI-Datenzentren mit neuer Spectrum‑XGS‑Technologie

KI‑Datenzentren stehen häufig vor dem Problem, dass der verfügbare Platz schnell erschöpft ist. Die klassische Lösung besteht darin, neue…

AI News (TechForge) 25.08.2025 10:00

Finde Modelle, Firmen und Themen

QTALE: Token‑basierte Layer-Ausführung kombiniert mit Quantisierung – Effiziente LLMs

DP-$\lambda$CGD: Effiziente Rauschkorrelation für privates Modelltraining

LLMs unter Soft-Error-Test: Erste Analyse der GPU-Ausfallanfälligkeit

CollectiveKV: Nutzerübergreifende KV-Caches für schnellere Empfehlungssysteme

KV‑Caching: So beschleunigen Sie LLM‑Inferenz in der Produktion

Neue probabilistische Lastvorhersage: M2OE2-GL skaliert für tausende Kunden

KRAL: KI-gestützte Antimicrobial‑Therapie mit verbessertem Wissen und Denken

MoE‑SpeQ: Spekulatives Quantisierung‑Decoding mit proaktivem Expert‑Prefetching

GEM+ setzt neue Maßstäbe: Skalierbare, datenschutzkonforme synthetische Daten

Transformer mit spektralen Filtern: 10 % bessere Vorhersagen bei Zeitreihen

NVIDIA löst Engpass in KI-Datenzentren mit neuer Spectrum‑XGS‑Technologie

🍪 Cookie-Einstellungen

Transformer mit spektralen Filtern: 10 % bessere Vorhersagen bei Zeitreihen