Chi-Quadrat-Test: Unterschied zwischen den Versionen
Zeile 26: | Zeile 26: | ||
-Häufigkeiten: Beobachtete Häufigkeiten und Erwartete Häufigkeiten | -Häufigkeiten: Beobachtete Häufigkeiten und Erwartete Häufigkeiten | ||
− | '''Erwartete Häufigkeit:''' | + | '''Erwartete Häufigkeit für die Unabhängigkeit von zwei Merkmalen:''' |
Falls die Nullhypothese gilt, falls also die Merkmale unabhängig sind, erwarten wir diese Häufigkeiten. | Falls die Nullhypothese gilt, falls also die Merkmale unabhängig sind, erwarten wir diese Häufigkeiten. |
Aktuelle Version vom 16. April 2020, 14:18 Uhr
- Chi-Quadrat-Tests gehören zu den einfachsten Verfahren der Inferenzstatistik.
- Es werden dabei Häufigkeiten ausgewertet.
- Das Verfahren ist für nominal-skalierte Daten geeignet
- Chi-Quadrat-Tests prüfen die Verteilung von Häufigkeiten gegenüber erwarteten Häufigkeiten
Beispiele:
Test auf Unabhängigkeit zweier Merkmale: Ist der Anteil der Brillenträger bei Männern und Frauen gleich?
Test für ein Merkmal: Wird eine von drei Apfelsorten häufiger gekauft als die anderen?
Test einer Verteilung: Ist die Bearbeitungszeit für eine Testaufgabe normalverteilt?
Test zur Verteilung eines Merkmals:
-Allgemein: Test zum Vergleich von Häufigkeiten einer nominalen Klassifikation
-Hypothesen: Nullhypothese und Alternativhypothese
-Häufigkeiten: Beobachtete Häufigkeiten und Erwartete Häufigkeiten
Erwartete Häufigkeit für die Unabhängigkeit von zwei Merkmalen:
Falls die Nullhypothese gilt, falls also die Merkmale unabhängig sind, erwarten wir diese Häufigkeiten.
Erwartete Häufigkeit = (Zeilensumme*Spaltensumme)/Gesammtsumme
Prüfgröße:
Die Prüfgröße ist ein Maß dafür, wie stark die beobachteten Häufigkeiten von den erwarteten Häufigkeiten abweichen
Formel: https://ibb.co/F5zwYZF
Berechnungen in R:
Test auf unabhängkeit zweier Merkmale:
Test auf Verteilung eines Merkmals:
Voraussetzungen:
Es gibt allerdings auch einige Voraussetzungen und Regeln, die erfüllt sein müssen, damit man den χ²-Test berechnen darf:
1. Die erwarteten Häufigkeiten in jeder Zelle müssen größer als 5 sein.
2. Der χ²-Test darf nur auf Häufigkeiten angewendet werden, niemals auf relative Werte, wie beispielsweise Prozentangaben.
3. Die Stichprobe ist zufällig entnommen worden.
Wozu dient der Test?
-Signifikanztest, der eingesetzt wird, um zwei nominal oder ordinal skalierte Variablen anhand der beobachteten Häufigkeiten ihrer Merkmalsausprägungen zu analysieren
-Der Test findet unter anderem Anwendung, wenn überprüft werden soll, ob zwei Variablen voneinander unabhängig sind