Neues Benchmark: Was-wäre-wenn-TSF prüft multimodale Prognosen
Die Vorhersage von Zeitreihen ist für viele Entscheidungen unverzichtbar, doch die meisten bestehenden Modelle bleiben eindimensional und stützen sich ausschließlich auf die Ausdehnung historischer Muster.
Mit dem Aufkommen großer Sprachmodelle (LLMs) eröffnet sich die Möglichkeit, Prognosen multimodal zu gestalten – also Text, Bild und Zahlen zu kombinieren. Bisher bieten die vorhandenen Benchmarks jedoch meist retrospektive oder nicht optimal ausgerichtete Kontextdaten, sodass nicht klar ist, ob die Modelle tatsächlich von Textinformationen profitieren.
In der Praxis nutzen menschliche Experten „Was-wäre-wenn“-Szenarien, um unter denselben Beobachtungen unterschiedliche Prognosen zu erstellen. Inspiriert von dieser Vorgehensweise stellt das neue Benchmark‑Set What If TSF (WIT) die Frage, ob Modelle ihre Vorhersagen gezielt an kontextuelle Texte, insbesondere zukünftige Szenarien, anpassen können.
WIT liefert sorgfältig erstellte, plausible oder kontrafaktische Szenarien, die als rigoroses Testfeld für scenario‑gesteuerte multimodale Prognosen dienen. Damit wird ein klarer Maßstab gesetzt, um die Fähigkeit von Modellen zu prüfen, Text als Leitfaden für ihre Vorhersagen zu nutzen.
Das Benchmark‑Set ist frei verfügbar unter https://github.com/jinkwan1115/WhatIfTSF.