Automatisierte Extraktion von Lehrbuchfragen – neue Pipeline für QA‑Daten
Ein neues Verfahren namens FlipVQA‑Miner ermöglicht es, aus Lehrbüchern und Übungsmaterialien automatisch hochwertige Frage‑Antwort‑Paare (QA) sowie visuelle Frage‑Antwort‑Paare (VQA) zu extrahieren. Durch die Kombination von layout‑sensitiven OCR‑Techniken mit semantischer Analyse durch große Sprachmodelle (LLMs) werden die Inhalte strukturiert und in ein formatgerechtes Format überführt, das für das Training von KI‑Modellen geeignet ist.