Chi-Quadrat-Test
- Chi-Quadrat-Tests gehören zu den einfachsten Verfahren der Inferenzstatistik.
- Es werden dabei Häufigkeiten ausgewertet.
- Das Verfahren ist für nominal-skalierte Daten geeignet
- Chi-Quadrat-Tests prüfen die Verteilung von Häufigkeiten gegenüber erwarteten Häufigkeiten
Beispiele:
Test auf Unabhängigkeit zweier Merkmale: Ist der Anteil der Brillenträger bei Männern und Frauen gleich?
Test für ein Merkmal: Wird eine von drei Apfelsorten häufiger gekauft als die anderen?
Test einer Verteilung: Ist die Bearbeitungszeit für eine Testaufgabe normalverteilt?
Test zur Verteilung eines Merkmals:
-Allgemein: Test zum Vergleich von Häufigkeiten einer nominalen Klassifikation
-Hypothesen: Nullhypothese und Alternativhypothese
-Häufigkeiten: Beobachtete Häufigkeiten und Erwartete Häufigkeiten
Erwartete Häufigkeit für die Unabhängigkeit von zwei Merkmalen:
Falls die Nullhypothese gilt, falls also die Merkmale unabhängig sind, erwarten wir diese Häufigkeiten.
Erwartete Häufigkeit = (Zeilensumme*Spaltensumme)/Gesammtsumme
Prüfgröße:
Die Prüfgröße ist ein Maß dafür, wie stark die beobachteten Häufigkeiten von den erwarteten Häufigkeiten abweichen
Formel: https://ibb.co/F5zwYZF
Berechnungen in R:
Test auf unabhängkeit zweier Merkmale:
Test auf Verteilung eines Merkmals:
Voraussetzungen:
Es gibt allerdings auch einige Voraussetzungen und Regeln, die erfüllt sein müssen, damit man den χ²-Test berechnen darf:
1. Die erwarteten Häufigkeiten in jeder Zelle müssen größer als 5 sein.
2. Der χ²-Test darf nur auf Häufigkeiten angewendet werden, niemals auf relative Werte, wie beispielsweise Prozentangaben.
3. Die Stichprobe ist zufällig entnommen worden.
Wozu dient der Test?
-Signifikanztest, der eingesetzt wird, um zwei nominal oder ordinal skalierte Variablen anhand der beobachteten Häufigkeiten ihrer Merkmalsausprägungen zu analysieren
-Der Test findet unter anderem Anwendung, wenn überprüft werden soll, ob zwei Variablen voneinander unabhängig sind