Suche nach Precision | meineki.news

AutoQRA: Optimale Quantisierung & LoRA für effizientes LLM‑Fine‑Tuning

In der Welt der großen Sprachmodelle (LLMs) ist die Kombination aus Quantisierung und parameter‑effizientem Feintuning zu einem vielverspre…

arXiv – cs.LG 27.02.2026 05:00

Forschung

CWM: Kontrastives Weltmodell verbessert Aktionsbewertung in Embodied Agents

In der Forschung zu Embodied Agents steht die zuverlässige Bewertung, welche Aktionen tatsächlich ausgeführt werden können, im Mittelpunkt…

arXiv – cs.AI 27.02.2026 05:00

Forschung

MoBiQuant: Token-angepasste, elastische Quantisierung für LLMs

Die Anforderungen an die Laufzeitkomplexität von Sprachmodellen variieren stark zwischen Cloud- und Edge-Geräten. Deshalb wird immer häufig…

arXiv – cs.LG 25.02.2026 05:00

Praxis

DeepSpeed verbessert Multimodal‑Training und Speicher‑Effizienz

DeepSpeed hat zwei bedeutende Neuerungen vorgestellt, die das Training von multimodalen Modellen revolutionieren. Die erste Innovation ist…

PyTorch – Blog 25.02.2026 00:45

Forschung

VINA: Variational Invertible Neural Architectures – Wege im Modellieren

Ein neues arXiv‑Paper (2602.20480v1) präsentiert VINA, ein einheitliches Konzept, das die Stärken von Normalizing Flows (NFs) und Invertibl…

arXiv – cs.LG 25.02.2026 05:00

Forschung

Rank-basierte Spektralgrenzen sichern stabile FP8-Transformer-Training

Ein neues arXiv-Papier liefert einen entscheidenden Fortschritt für das Training von Transformer‑Modellen in extrem niedriger Präzision. Du…

arXiv – cs.LG 24.02.2026 05:00

Produkt

Sonrai nutzt Amazon SageMaker AI, um Präzisionsmedizin-Studien zu beschleunigen

Sonrai, ein Unternehmen im Bereich Life Sciences und KI, hat mit Amazon Web Services zusammengearbeitet, um ein leistungsfähiges MLOps-Fram…

AWS – Machine Learning Blog 23.02.2026 17:31

Forschung

ScaleBITS: Bitbreitenanpassung für effiziente, hardwarefreundliche LLMs

ScaleBITS ist ein neues Quantifizierungsframework, das die Nachtrainingsgewichtsanpassung von großen Sprachmodellen (LLMs) optimiert. Ziel…

arXiv – cs.AI 23.02.2026 05:00

Forschung

SpecMuon: Spektraler Optimierer beschleunigt physikbasierte neuronale Netze

We need to produce the output: the same text but with the German translation. The instruction: "Translate the following text into German. T…

arXiv – cs.LG 19.02.2026 05:00

Forschung

Neues Modell: Predictive Associative Memory nutzt zeitliche Ko‑Ereignisse statt Ähnlichkeit

In einer wegweisenden Veröffentlichung auf arXiv wird ein neues Konzept für neuronale Speichersysteme vorgestellt: Predictive Associative M…

arXiv – cs.LG 13.02.2026 05:00

Forschung

LLM-Interaktion neu gedacht: Dynamische Präzisionswahl spart Kosten

Ein neuer Ansatz aus dem arXiv-Preprint 2602.02711v1 zeigt, wie große Sprachmodelle (LLMs) bei komplexen Entscheidungsaufgaben effizienter…

arXiv – cs.AI 04.02.2026 05:00

Forschung

Sprach-, Sicht- und Handlungsmodelle zeigen überraschende Übereinstimmung

Eine neue Studie aus dem Bereich der Kognitionswissenschaft und künstlichen Intelligenz hat gezeigt, dass Modelle, die auf unterschiedliche…

arXiv – cs.AI 02.02.2026 05:00

Forschung

Neues Quantisierungskonzept: Soft Quantization komprimiert neuronale Netze

In einer kürzlich veröffentlichten Studie auf arXiv wird ein innovatives Quantisierungskonzept namens Soft Quantization vorgestellt. Das Ve…

arXiv – cs.LG 30.01.2026 05:00

Forschung

Präzision trifft Frühwarnung: KI erkennt Seizure und Kundenabwanderung

Ein brandneues Machine‑Learning-Verfahren verspricht, kritische Ereignisse wie epileptische Anfälle, plötzliche Kundenabwanderung oder soga…

arXiv – cs.LG 30.01.2026 05:00

Forschung

CASL: Supervised Alignment Sparse Latents zur Interpretation Diffusionsmodelle

In Diffusionsmodellen speichern die internen Aktivierungen reichhaltige semantische Informationen, die jedoch bislang schwer zu deuten sind…

arXiv – cs.LG 23.01.2026 05:00

Forschung

Deep Learning steigert Genauigkeit bei Sperm-Qualitätsbewertung mit WHO-Kriterien

Die Bewertung der Spermienmorphologie ist ein entscheidender, aber stark subjektiver Bestandteil der männlichen Fruchtbarkeitsdiagnostik. I…

arXiv – cs.LG 16.01.2026 05:00

Forschung

Moderate Summary Injection Boosts RAG Recall, Excessive Lowers Precision

In einer kürzlich veröffentlichten Studie zum Thema Retrieval‑Augmented Generation (RAG) wurde gezeigt, dass die Technik des „Contextualize…

arXiv – cs.AI 15.01.2026 05:00

Forschung

Neuer Algorithmus BUILD rekonstruiert lineare DAGs exakt

In der Kausalitätsforschung ist die Rekonstruktion von gerichteten azyklischen Graphen (DAGs) aus Beobachtungsdaten ein zentrales Ziel. Unt…

arXiv – cs.LG 19.12.2025 05:00

Forschung

Context-Picker: Dynamische Kontextauswahl mit mehrstufigem Reinforcement Learning

In der langen Kontextfragebeantwortung (Long‑Context QA) stellt die Wahl des optimalen Kontextumfangs ein zentrales Problem dar. Zu wenige…

arXiv – cs.AI 17.12.2025 05:00

Forschung

Neues Framework komprimiert und quantisiert PINNs für Edge-Devices

Physik-Informed Neural Networks (PINNs) haben sich als vielversprechende Methode etabliert, um partielle Differentialgleichungen (PDEs) zu…

arXiv – cs.LG 11.12.2025 05:00

Forschung

LAPA: Neuer sparsamer Accelerator für Transformer mit Log‑Domain‑Vorhersage

Die neuesten Transformer‑Modelle haben die Verarbeitung natürlicher Sprache und Bilddaten revolutioniert. Doch je nach Eingabesequenz verän…

arXiv – cs.LG 10.12.2025 05:00

Forschung

LLMs auf Mobilgeräten: 4‑Bit‑Quantisierung reduziert Modellgröße um 69 %

Large Language Models (LLMs) bieten enorme Möglichkeiten, doch ihre Größe und der hohe Rechenaufwand machen ein direktes Ausführen auf Smar…

arXiv – cs.LG 09.12.2025 05:00

Forschung

CompassMax‑V3‑Thinking: RL für hundert Milliarden MoE ohne Rollout‑Verlust

Das neue Modell CompassMax‑V3‑Thinking setzt einen Meilenstein in der Skalierung von Reinforcement‑Learning (RL) auf hundert Milliarden Par…

arXiv – cs.AI 09.12.2025 05:00

Forschung

Neues Deep‑Learning‑Tool hilft Bitcoin‑Miner beim optimalen Kaufzeitpunkt

Die Entscheidung, wann neue ASIC‑Miner für Bitcoin gekauft werden sollen, ist wegen volatiler Märkte, schneller technischer Veralterung und…

arXiv – cs.LG 08.12.2025 05:00

Forschung

ChemBERTa optimiert: KI vorhersagt TDP1-Inhibitoren mit hoher Genauigkeit

In einem wegweisenden Beitrag zur frühen Wirkstoffentwicklung präsentiert ein internationales Forschungsteam ein Deep‑Learning‑Framework, d…

arXiv – cs.LG 05.12.2025 05:00

Forschung

Kontextbewusste MoE-Inferenz auf CXL-fähigen GPU‑NDP-Systemen

Die neueste Forschung zeigt, wie Mixture‑of‑Experts‑Modelle (MoE) die Skalierung großer Sprachmodelle durch bedingte Berechnung beschleunig…

arXiv – cs.LG 05.12.2025 05:00

Forschung

CUDA-L2: KI-gestützte Optimierung übertrifft cuBLAS bei Matrixmultiplikation

Ein neues System namens CUDA‑L2 kombiniert große Sprachmodelle mit Reinforcement‑Learning, um Half‑Precision General Matrix Multiply (HGEMM…

arXiv – cs.LG 03.12.2025 05:00

Forschung

Maschinelles Lernen optimiert Laser‑Mikromachining für nachhaltige Präzision

In der nachhaltigen Fertigung gewinnt die ultrakurze Pulslaser‑Mikromachining immer mehr an Bedeutung, weil sie hohe Präzision und qualitat…

arXiv – cs.AI 03.12.2025 05:00

Forschung

Neuer Graph-Transformer-VAE revolutioniert Link‑Prediction

In einer kürzlich veröffentlichten Arbeit auf arXiv (2512.00612v1) stellen die Autoren den Generalized Graph Transformer Variational Autoen…

arXiv – cs.LG 02.12.2025 05:00

Forschung

Xmodel‑2.5: 1,3 Milliarden‑Parameter‑Modell für effizientes Edge‑Reasoning

Die neuesten Fortschritte in der KI zeigen, dass große Sprachmodelle exzellente Fähigkeiten im logischen Denken und bei Tool‑Nutzung besitz…

arXiv – cs.LG 26.11.2025 05:00

Finde Modelle, Firmen und Themen

AutoQRA: Optimale Quantisierung & LoRA für effizientes LLM‑Fine‑Tuning

CWM: Kontrastives Weltmodell verbessert Aktionsbewertung in Embodied Agents

MoBiQuant: Token-angepasste, elastische Quantisierung für LLMs

DeepSpeed verbessert Multimodal‑Training und Speicher‑Effizienz

VINA: Variational Invertible Neural Architectures – Wege im Modellieren

Rank-basierte Spektralgrenzen sichern stabile FP8-Transformer-Training

Sonrai nutzt Amazon SageMaker AI, um Präzisionsmedizin-Studien zu beschleunigen

ScaleBITS: Bitbreitenanpassung für effiziente, hardwarefreundliche LLMs

SpecMuon: Spektraler Optimierer beschleunigt physikbasierte neuronale Netze

Neues Modell: Predictive Associative Memory nutzt zeitliche Ko‑Ereignisse statt Ähnlichkeit

LLM-Interaktion neu gedacht: Dynamische Präzisionswahl spart Kosten

Sprach-, Sicht- und Handlungsmodelle zeigen überraschende Übereinstimmung

Neues Quantisierungskonzept: Soft Quantization komprimiert neuronale Netze

Präzision trifft Frühwarnung: KI erkennt Seizure und Kundenabwanderung

CASL: Supervised Alignment Sparse Latents zur Interpretation Diffusionsmodelle

Deep Learning steigert Genauigkeit bei Sperm-Qualitätsbewertung mit WHO-Kriterien

Moderate Summary Injection Boosts RAG Recall, Excessive Lowers Precision

Neuer Algorithmus BUILD rekonstruiert lineare DAGs exakt

Context-Picker: Dynamische Kontextauswahl mit mehrstufigem Reinforcement Learning

Neues Framework komprimiert und quantisiert PINNs für Edge-Devices

LAPA: Neuer sparsamer Accelerator für Transformer mit Log‑Domain‑Vorhersage

LLMs auf Mobilgeräten: 4‑Bit‑Quantisierung reduziert Modellgröße um 69 %

CompassMax‑V3‑Thinking: RL für hundert Milliarden MoE ohne Rollout‑Verlust

Neues Deep‑Learning‑Tool hilft Bitcoin‑Miner beim optimalen Kaufzeitpunkt

ChemBERTa optimiert: KI vorhersagt TDP1-Inhibitoren mit hoher Genauigkeit

Kontextbewusste MoE-Inferenz auf CXL-fähigen GPU‑NDP-Systemen

CUDA-L2: KI-gestützte Optimierung übertrifft cuBLAS bei Matrixmultiplikation

Maschinelles Lernen optimiert Laser‑Mikromachining für nachhaltige Präzision

Neuer Graph-Transformer-VAE revolutioniert Link‑Prediction

Xmodel‑2.5: 1,3 Milliarden‑Parameter‑Modell für effizientes Edge‑Reasoning

🍪 Cookie-Einstellungen

LLMs auf Mobilgeräten: 4‑Bit‑Quantisierung reduziert Modellgröße um 69 %

Xmodel‑2.5: 1,3 Milliarden‑Parameter‑Modell für effizientes Edge‑Reasoning