KI-Wissensgraph aus Vorlesungsnotizen: Rate-Distortion-Ansatz verbessert MCQs
Ein neues Forschungsprojekt aus dem Bereich der künstlichen Intelligenz zeigt, wie aus unstrukturierten Vorlesungsnotizen automatisch hochwertige Multiple‑Choice‑Fragen (MCQs) generiert werden können. Dabei wird ein Wissensgraph (KG) erstellt, der die wichtigsten Lerninhalte strukturiert abbildet.
Der Ansatz basiert auf der Rate‑Distortion‑Theorie und der optimalen Transportgeometrie. Vorlesungsinhalte werden als metrisch‑messbarer Raum modelliert, während Kandidaten‑KGs mithilfe von Fused Gromov‑Wasserstein‑Kopplungen auf semantische Verzerrung geprüft werden. Der Rate‑Term, der die Größe des Graphen widerspiegelt, dient als Maß für Komplexität und Kompaktheit.
Durch gezielte Optimierungsoperatoren – Hinzufügen, Zusammenführen, Aufteilen, Entfernen und Umverknüpfen von Knoten – wird die Rate‑Distortion‑Lagrange‑Funktion minimiert. Das Ergebnis sind kompakte, informationsbewahrende Graphen, die als Basis für die Fragegenerierung dienen.
In einem Prototypen, der auf Daten‑Science‑Vorlesungen angewendet wurde, konnten die Forscher interpretierbare RD‑Kurven erzeugen und nachweisen, dass die aus den optimierten Graphen generierten MCQs in allen fünfzehn Qualitätskriterien besser abschneiden als Fragen, die direkt aus den Rohnotizen abgeleitet wurden. Das Verfahren legt damit einen theoretisch fundierten Grundstein für die KI‑gestützte Optimierung von Wissensgraphen in der personalisierten Bildung.