Gibt mehr Daten immer bessere Ergebnisse?
Der Beitrag untersucht die weit verbreitete Annahme, dass mehr Daten automatisch zu besseren Modellergebnissen führen. Durch gezielte Experimente mit unterschiedlichen Stichprobengrößen, Attributmengen und Modellkomplexitäten wird gezeigt, dass die Beziehung nicht immer linear verläuft und dass zusätzliche Daten manchmal sogar die Leistung verschlechtern können.