Neuer Ansatz: Kausale Entdeckung durch Austauschbarkeit neu gedacht
In einer kürzlich veröffentlichten Arbeit auf arXiv wird ein frischer Blick auf die Kausale Entdeckung geworfen. Anstelle der traditionellen Unterscheidung zwischen unabhängigen, identisch verteilten (i.i.d.) Daten und Zeitreihen wird die i.i.d.-Regel als Teil eines allgemeineren Symmetrieprinzips – der Austauschbarkeit – betrachtet.
Die Autoren führen zwei zentrale Argumente an. Erstens zeigen sie konzeptionell, dass die Abhängigkeit experimenteller Kausalinferenz von Austauschbarkeit auch auf die Entdeckung von Kausalbeziehungen übertragen werden kann. Zweitens liefern sie empirische Belege dafür, dass viele etablierte i.i.d.-Methoden tatsächlich auf Austauschbarkeit beruhen und dass das einzige weit verbreitete reale i.i.d.-Benchmark (das Tübingen-Dataset) überwiegend aus austauschbaren, nicht i.i.d., Beispielen besteht.
Auf dieser Grundlage stellen die Forscher ein neues synthetisches Datenset vor, das ausschließlich die Austauschbarkeit voraussetzt und die stärkere i.i.d.-Annahme vermeidet. Sie zeigen, dass dieses Datenset die statistische Struktur des realen Benchmarks deutlich besser abbildet als bisherige i.i.d.-synthetische Daten. Darüber hinaus demonstrieren sie die Nützlichkeit des Datensets, indem sie einen neuronalen Netzwerk-Algorithmus entwickeln, der ausschließlich auf dem neuen Datenset trainiert wird und auf dem realen Benchmark ähnliche Leistungen wie moderne i.i.d.-Methoden erzielt.