Pharos-ESG: Neues Framework für strukturierte ESG-Berichte
ESG‑Prinzipien verändern die Grundlagen der globalen Finanz‑Governance und bestimmen zunehmend, wie Kapital verteilt wird, welche Regulierungen gelten und wie systemische Risiken koordiniert werden. Damit die Unternehmensleistung in diesen Bereichen transparent bewertet werden kann, sind ESG‑Reports unverzichtbar – doch ihre chaotische Anordnung und die fehlende Struktur erschweren ein umfassendes Verständnis.
Pharos‑ESG adressiert diese Probleme, indem es ESG‑Berichte in strukturierte Darstellungen überführt. Das System kombiniert multimodales Parsen, kontextuelle Erzählung und hierarchisches Labeling, um die Inhalte von Text, Tabellen, Diagrammen und anderen visuellen Elementen zu erfassen.
Im Kern nutzt Pharos‑ESG ein Layout‑Flow‑Modul, das die Lesereihenfolge modelliert, sowie eine hierarchiebewusste Segmentierung, die sich an Inhaltsverzeichnissen orientiert. Anschließend aggregiert ein multimodaler Pipeline die visuellen Informationen zu zusammenhängenden Texten, die anschließend mit ESG‑, GRI‑ und Sentiment‑Labels versehen werden.
Umfangreiche Experimente auf annotierten Benchmarks zeigen, dass Pharos‑ESG sowohl bestehende Dokumenten‑Parsing‑Systeme als auch generische multimodale Modelle übertrifft. Das Framework liefert präzise, analytisch nutzbare Strukturen, die speziell auf die Anforderungen der Finanzforschung zugeschnitten sind.
Zur Förderung weiterer Forschung stellt das Team zudem Aurora‑ESG vor – das erste groß angelegte öffentliche Datenset von ESG‑Berichten aus China, Hongkong und den USA. Es bietet einheitliche, strukturierte Darstellungen multimodaler Inhalte und bildet damit eine wertvolle Ressource für die wissenschaftliche Gemeinschaft.