KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “llama.cpp”

Effiziente LLM- und MLLM-Inferenz auf Apple Silicon mit vllm-mlx

Mit der rasanten Verbreitung von Apple Silicon im Bereich des maschinellen Lernens wächst der Bedarf an leistungsstarken Inferenzlösungen…

arXiv – cs.LG 28.01.2026 05:00

Quantisierung für Llama-3.1-8B-Instruct: Einheitliche Bewertung von llama.cpp

Quantisierung ist ein bewährtes Verfahren, um große Sprachmodelle ressourcenschonender zu betreiben. Durch die Reduktion der Präzision der…

arXiv – cs.LG 22.01.2026 05:00

NVIDIA RTX beschleunigt 4K KI-Videoerstellung – LTX-2 & ComfyUI-Updates

Im Jahr 2025 erlebte die KI-Entwicklung auf dem PC einen Durchbruch, der die Grenzen zwischen Desktop- und Cloud-Lösungen drastisch verkürz…

NVIDIA – Blog 06.01.2026 05:30

IREE erweitert RISC‑V‑Support: Schnellere GenAI‑Workloads dank neuer Microkernels

Das neueste Update von IREE, dem MLIR‑basierten Compiler und Laufzeit für maschinelles Lernen, bringt erstmals vollständigen RISC‑V‑Microke…

arXiv – cs.AI 22.08.2025 05:00