MLflow: Versionierung und Regressionstests für LLM‑Prompts
In diesem Tutorial wird gezeigt, wie man Prompt‑Texte als eigenständige, versionierte Artefakte behandelt und gleichzeitig strenge Regressionstests für das Verhalten großer Sprachmodelle einsetzt. Durch die Nutzung von MLflow entsteht ein vollständig reproduzierbarer Evaluations‑Workflow, der jede Prompt‑Version, die Unterschiede zwischen Versionen, die Modellantworten und mehrere Qualitätsmetriken protokolliert.