Text2Graph: LLMs & GNNs für effiziente Textklassifizierung bei knappen Labels
Ein neues Open‑Source‑Python‑Paket namens Text2Graph kombiniert leichte Large Language Models (LLMs) mit Graph Neural Networks (GNNs), um Textklassifizierungen in Szenarien mit wenigen Labels effizienter zu gestalten. Das Tool ermöglicht es Anwendern, LLM‑basierte Teilannotationen mit GNN‑Label‑Propagation zu verknüpfen und dabei sämtliche Bausteine – von Feature‑Extractoren über Kantenerstellung bis hin zu Sampling‑Strategien – flexibel auszutauschen.
In einer umfassenden Benchmark‑Studie wurde Text2Graph in einer Zero‑Shot-Umgebung auf fünf unterschiedlichen Datensätzen getestet, die Themenklassifikation und Sentiment‑Analyse abdecken. Die Ergebnisse zeigen, dass die graphbasierte Propagation nicht nur mit etablierten Zero‑Shot‑Ansätzen konkurriert, sondern dabei deutlich weniger Rechenleistung benötigt.
Besonders hervorzuheben ist die Analyse des Energieverbrauchs und der CO₂‑Emissionen. Die Autoren berichten, dass die Kombination aus LLM‑Partialannotation und GNN‑Propagation die Leistung um ein Vielfaches steigert, während gleichzeitig der Energieaufwand um einen großen Teil reduziert wird. Damit bietet Text2Graph einen nachhaltigen Ansatz für große Annotation‑Workflows in Hochleistungsrechnerumgebungen.