k‑NN Regressor in Excel: Einstieg in den ML‑Adventskalender

Towards Data Science Original ≈1 Min. Lesezeit
Anzeige

Der erste Tag des ML‑Adventskalenders führt uns in die Welt des k‑Nearest‑Neighbors (k‑NN) Regressors ein – das einfachste Modell, das ausschließlich auf Entfernungen zwischen Beobachtungen basiert. In Excel zeigen wir, wie Vorhersagen ausschließlich von den nächsten Nachbarn abhängen und warum die Skalierung der Merkmale entscheidend ist, um sinnvolle Distanzen zu erhalten.

Besonders interessant wird es, wenn heterogene Variablen ins Spiel kommen: Unterschiedliche Skalen und Typen (kontinuierlich vs. kategorial) können die Distanzmessung verfälschen und damit die Genauigkeit der Vorhersagen stark beeinträchtigen. Durch praxisnahe Beispiele mit den Datensätzen California Housing und Diamonds demonstrieren wir die Stärken und Grenzen von k‑NN. Dabei wird klar, dass die Wahl der richtigen Distanzfunktion – sie muss die reale Struktur der Daten widerspiegeln – ein entscheidender Faktor für den Erfolg des Modells ist.

Mit diesem Einstieg erhalten Sie ein solides Fundament, um k‑NN in Excel zu implementieren, die wichtigsten Feinheiten zu verstehen und die Grundlagen für weiterführende Machine‑Learning‑Techniken zu legen.

Ähnliche Artikel