Die Diskriminanzanalyse wird in der Statistik angewendet und dient zur Trennung von zwei oder mehreren Gruppen, welche mit ebenso vielen Merkmalen beschrieben werden. Die Merkmale innerhalb der Gruppen können weiter geprüft werden.
Das erste Mal beschrieben wurde diese Analyse im Jahr 1936 von R. A. Fisher.
Anleitung einer Diskriminanzanalyse
Multivariate Normalität
Die Datenwerte stammen aus einer Normalverteilung. Wir können einen Normalitäts-Test verwenden, um dies zu überprüfen. Bitte beachten Sie jedoch, dass normale Annahmen in der Regel nicht “tödlich” sind.
Gleichheit der Varianz-Kovarianz innerhalb der Gruppe
Die Kovarianzmatrix innerhalb jeder Gruppe sollte gleich sein. Gleichheitstest der Kovarianz Matrizen können verwendet werden, um sie zu verfeinern. Versuchen Sie im Zweifelsfall erneut, die Analysen mit der Quadratischen Methode auszuführen, oder indem Sie weitere Beobachtungen hinzufügen oder eine oder zwei Gruppen ausschließen.
Niedrige Multikollinearität der Variablen
Wenn eine hohe Multikollinearität zwischen zwei oder mehr Variablen vorhanden ist, werden die Diskriminanzfunktionskoeffizienten die Gruppenmitgliedschaft nicht zuverlässig vorhersagen. Wenn Korrelationskoeffizienten größer als 0,8 vorhanden sind, müssen Sie einige Variablen ausschließen oder zuerst die Prinzip-Komponenten-Analyse verwenden.
Genug Stichprobenumfang
In der Regel sollte die Stichprobengröße der kleinsten Gruppe die Anzahl der Variablen überschreiten. Es sollten mindestens 5 Beobachtungen für jede Variable vorhanden sein.
Dividieren der Probe
Die Klassifikationsübersicht der Trainingsdaten wertet die Beobachtung über die aus denselben Daten abgeleiteten Diskriminanzfunktionen aus. Die “Fehlerrate” ist üblicherweise größer, wenn der Anwender die Testdaten auswertet, die nicht für die diskrete Funktionsschätzung verwendet werden. Wir werden daher die Menge der Beobachtungen zufällig in Teilmengen aufteilen, von denen die erste für die Schätzung des Diskriminantenmodells verwendet wird, und zum anderen für die Prüfung der Zuverlässigkeit der Ergebnisse. Allerdings, wenn der Benutzer die Stichprobe zuteilen will, sollte es groß genug sein. Die Stichprobengröße sollte typischerweise größer als 100.
Identifizierbare Vorwahrscheinlichkeiten
Die Diskriminanzanalyse geht davon aus, dass vorherige Wahrscheinlichkeiten der Gruppenmitgliedschaft identifizierbar sind. Wenn die Gruppenpopulationsgröße ungleich ist, können sich die vorherigen Wahrscheinlichkeiten unterscheiden. Wenn Sie feststellen, dass N für jede Gruppe in der beschreibenden Statistik-Tabelle unterschiedlich ist, verwenden Sie proportional zur Gruppengröße für die Option Pior-Wahrscheinlichkeiten.
Interpretation und Überprüfung der Ergebnisse einer Diskriminanzanalyse
Auf der Seite Interpretationsergebnisse finden Sie Informationen zum Bearbeiten von Diskriminanzfunktionen, zur Beurteilung, ob die Diskriminanzfunktionen gut sind oder nicht, und die Klassifizierung von Beobachtungen.
Um die Ergebnisse zu überprüfen, können wir zwischen dem Ergebnis der Testdaten und der Kreuzvalidierung von Trainingsdaten entscheiden. Bitte beachten Sie jedoch, dass beide Methoden empfindlich für die Stichprobengröße sind. Wenn die Stichprobengröße klein ist, ist das Ergebnis möglicherweise nicht zuverlässig.