Simulierte Daten: Können sie Psychotherapie-Ergebnisse besser vorhersagen?
In der personalisierten Medizin gewinnt maschinelles Lernen immer mehr an Bedeutung. Damit diese Algorithmen jedoch zuverlässig arbeiten, benötigen sie große Mengen an Daten – ein Problem, das gerade bei psychotherapeutischen Studien häufig auftritt.
Eine neue Studie aus dem Bereich der künstlichen Intelligenz schlägt einen alternativen Ansatz vor: Statt ausschließlich reale Patientendaten zu nutzen, werden simulierte Datensätze erzeugt, die auf veröffentlichten Zusammenfassungsstatistiken basieren. Diese synthetischen Daten dienen als Ausgangspunkt, um Random‑Forest‑Modelle vorzutrainieren, die anschließend mit einem echten Datensatz feinjustiert werden.
Die Ergebnisse waren zunächst gemischt. In der ersten Untersuchung zeigte sich, dass die vortrainierten Modelle die Standard‑Random‑Forest‑Modelle leicht übertrafen – jedoch nicht signifikant. In einer zweiten, methodisch verbesserten Studie erwies sich das Modell, das ausschließlich mit realen Daten trainiert wurde, als überlegen. Die statistische Analyse erfolgte über ein Monte‑Carlo‑Cross‑Validation‑Framework mit 100 Durchläufen, um die Stabilität der Befunde zu prüfen.
Die Autoren betonen, dass die Verfügbarkeit von aussagekräftigen Publikationen ein entscheidender Faktor ist und raten zu weiteren Untersuchungen, um die Grenzen und Potenziale von simulierten Daten in der Psychotherapie‑Prognostik besser zu verstehen.