KI trifft Ästhetik: LLMs und Vision‑Modelle optimieren Netzwerkvisualisierung
Die Darstellung von Netzwerken wird seit langem von heuristischen Metriken wie dem Stresswert bestimmt, die davon ausgehen, dass deren Optimierung ästhetisch ansprechende und informative Layouts erzeugt. In der Praxis l…
- Die Darstellung von Netzwerken wird seit langem von heuristischen Metriken wie dem Stresswert bestimmt, die davon ausgehen, dass deren Optimierung ästhetisch ansprechend…
- In der Praxis liefert jedoch keine einzelne Kennzahl konstant die besten Ergebnisse.
- Eine datengetriebene Alternative besteht darin, menschliche Vorlieben zu erlernen: Annotatoren wählen aus mehreren Layouts die für sie ansprechendste Visualisierung aus.
Die Darstellung von Netzwerken wird seit langem von heuristischen Metriken wie dem Stresswert bestimmt, die davon ausgehen, dass deren Optimierung ästhetisch ansprechende und informative Layouts erzeugt. In der Praxis liefert jedoch keine einzelne Kennzahl konstant die besten Ergebnisse.
Eine datengetriebene Alternative besteht darin, menschliche Vorlieben zu erlernen: Annotatoren wählen aus mehreren Layouts die für sie ansprechendste Visualisierung aus. Diese Präferenzlabels können anschließend ein generatives Modell trainieren, das die menschliche Ästhetik nachahmt. Der Nachteil ist, dass die Beschaffung solcher Labels in großem Umfang teuer und zeitaufwendig ist, weshalb bisher nur maschinell gelabelte Daten verwendet wurden.
In der vorliegenden Studie wurden große Sprachmodelle (LLMs) und Bildmodelle (Vision‑Models, VMs) als Ersatz für menschliche Urteilsfähigkeit eingesetzt. Durch eine sorgfältig konzipierte Nutzerstudie mit 27 Teilnehmern wurde ein umfangreicher Datensatz menschlicher Präferenzen erstellt, der sowohl zur Analyse menschlicher Vorlieben als auch zur Schulung der LLM/VM‑Labeler diente.
Die Ergebnisse zeigen, dass eine Prompt‑Engineering‑Strategie, die wenige Beispielantworten und vielfältige Eingabeformate wie Bild‑Embeddings kombiniert, die Übereinstimmung zwischen LLM und Mensch deutlich verbessert. Zusätzlich führt eine Filterung nach dem Vertrauenswert des LLMs die Ausrichtung auf das Niveau menschlicher Konsistenz.
Gleichzeitig demonstrieren sorgfältig trainierte VMs eine Übereinstimmung mit menschlichen Präferenzen, die dem Niveau zwischen menschlichen Annotatoren entspricht. Diese Befunde deuten darauf hin, dass KI als skalierbarer Ersatz für menschliche Labeler praktikabel ist.
Welche Linse du auf diese Meldung legen solltest
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.