KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “QLORA”

Stabile und effiziente QLoRA-Fine‑Tuning‑Pipeline mit Unsloth für große Sprachmodelle

In einem neuen Tutorial wird gezeigt, wie man ein großes Sprachmodell mit Unsloth und QLoRA effizient feinabstimmt. Der Fokus liegt dabei a…

MarkTechPost 03.03.2026 22:29

EdgeNav‑QE: 4‑Bit‑Quantisierung & dynamischer Early Exit für LAM‑Navigation auf Edge

Mit dem neuen Framework EdgeNav‑QE gelingt es, große Aktionsmodelle (LAMs) – die komplexe Entscheidungen mit präziser Steuerung verbinden –…

arXiv – cs.AI 19.02.2026 05:00

Leichtgewichtiges LLM-Framework verbessert Krisen-Info-Klassifizierung

Die schnelle Klassifizierung von Hilfsinformationen aus sozialen Medien ist entscheidend für eine effektive Katastrophenreaktion. Doch groß…

arXiv – cs.AI 16.02.2026 05:00

<p>In diesem Tutorial wird ein End‑to‑End‑Workflow für Direct Preference Optimization vorgestellt, mit dem große Sprachmodelle an menschliche Präferenzen angepasst werden können – und das ganz ohne ein Reward‑Modell.</p> <p>Der Ansatz kombiniert TRL’s DPOTrainer mit QLoRA und PEFT, sodass die Präferenzbasierte Ausrichtung auf einer einzigen Colab‑GPU möglich ist.</p> <p>Das Training erfolgt direkt auf dem binarisierten UltraFeedback‑Datensatz, bei dem jedes Prompt ein binäres Feedback erhält. Dadurch lassen

MarkTechPost 13.02.2026 04:32

RFX: Random Forests mit GPU‑Beschleunigung und QLORA‑Kompression

Die neue Open‑Source‑Bibliothek RFX (Random Forests X) bringt die klassische Random‑Forest‑Methode von Breiman und Cutler in die moderne Py…

arXiv – cs.LG 26.11.2025 05:00

Spectrum-Fine-Tuning steigert Effizienz von FM-Training auf Amazon SageMaker AI

In diesem Beitrag erfahren Sie, wie Sie mit Spectrum die Ressourcennutzung optimieren und Trainingszeiten verkürzen können, ohne die Qualit…

AWS – Machine Learning Blog 19.11.2025 15:51