Tag 3 des ML-Adventskalenders: GNB, LDA und QDA in Excel erklärt

Towards Data Science Original ≈2 Min. Lesezeit
Anzeige

Der ML-Adventskalender bietet jeden Tag ein neues Thema rund um maschinelles Lernen. Am dritten Tag geht es um klassische Klassifikationsalgorithmen – Gaussian Naive Bayes, Linear Discriminant Analysis und Quadratic Discriminant Analysis – und wie man sie direkt in Excel umsetzt.

Gaussian Naive Bayes (GNB) nutzt die Annahme, dass die Merkmale innerhalb jeder Klasse normalverteilt sind. Durch die Berechnung der bedingten Wahrscheinlichkeiten für jede Klasse kann GNB schnell Vorhersagen treffen, ohne dass komplexe Modelle trainiert werden müssen.

Linear Discriminant Analysis (LDA) sucht nach einer linearen Kombination der Merkmale, die die Trennung zwischen den Klassen maximiert. LDA ist besonders nützlich, wenn die Klassen ähnliche Kovarianzmatrizen aufweisen, da es die gemeinsame Streuung nutzt, um die Trennlinie zu bestimmen.

Quadratic Discriminant Analysis (QDA) erweitert LDA, indem es jeder Klasse eine eigene Kovarianzmatrix zuweist. Dadurch kann QDA nichtlineare Trennflächen modellieren, was bei stark unterschiedlichen Streuungen zwischen den Klassen von Vorteil ist.

In Excel lassen sich diese Verfahren mit einfachen Formeln und Matrixfunktionen realisieren. Man beginnt mit der Berechnung der Mittelwerte und Kovarianzmatrizen, erstellt anschließend die Wahrscheinlichkeitsfunktionen und wendet schließlich die Klassifikationsregeln an. Durch die Verwendung von Pivot‑Tabellen und bedingter Formatierung lassen sich die Ergebnisse anschaulich visualisieren.

Der Artikel zeigt, wie man von lokalen Distanzen zu globalen Wahrscheinlichkeiten übergeht und dabei die Leistungsfähigkeit von Excel als Werkzeug für maschinelles Lernen nutzt. Für alle, die ihre Datenanalyse ohne zusätzliche Software erweitern wollen, bietet dieser Beitrag einen klaren und praxisnahen Einstieg in GNB, LDA und QDA.

Ähnliche Artikel