Chi-Quadrat-Test: Unterschied zwischen den Versionen
(15 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
+ | '''-''' Chi-Quadrat-Tests gehören zu den einfachsten Verfahren der Inferenzstatistik. | ||
+ | '''-''' Es werden dabei Häufigkeiten ausgewertet. | ||
+ | '''-''' Das Verfahren ist für nominal-skalierte Daten geeignet | ||
+ | |||
+ | '''-''' Chi-Quadrat-Tests prüfen die Verteilung von Häufigkeiten gegenüber erwarteten Häufigkeiten | ||
+ | |||
+ | ---- | ||
+ | |||
+ | '''Beispiele:''' | ||
+ | |||
+ | ''Test auf Unabhängigkeit zweier Merkmale'': Ist der Anteil der Brillenträger bei Männern und Frauen gleich? | ||
+ | |||
+ | ''Test für ein Merkmal'': Wird eine von drei Apfelsorten häufiger gekauft als die anderen? | ||
+ | |||
+ | ''Test einer Verteilung'': Ist die Bearbeitungszeit für eine Testaufgabe normalverteilt? | ||
+ | |||
+ | ''Test zur Verteilung eines Merkmals'': | ||
+ | |||
+ | -Allgemein: Test zum Vergleich von Häufigkeiten einer nominalen Klassifikation | ||
+ | |||
+ | -Hypothesen: Nullhypothese und Alternativhypothese | ||
+ | |||
+ | -Häufigkeiten: Beobachtete Häufigkeiten und Erwartete Häufigkeiten | ||
+ | |||
+ | '''Erwartete Häufigkeit für die Unabhängigkeit von zwei Merkmalen:''' | ||
+ | |||
+ | Falls die Nullhypothese gilt, falls also die Merkmale unabhängig sind, erwarten wir diese Häufigkeiten. | ||
+ | |||
+ | Erwartete Häufigkeit = (Zeilensumme*Spaltensumme)/Gesammtsumme | ||
+ | |||
+ | '''Prüfgröße:''' | ||
+ | |||
+ | Die Prüfgröße ist ein Maß dafür, wie stark die beobachteten Häufigkeiten von den erwarteten Häufigkeiten abweichen | ||
+ | |||
+ | ''Formel:'' | ||
+ | https://ibb.co/F5zwYZF | ||
+ | |||
+ | ---- | ||
+ | |||
+ | '''Berechnungen in R:''' | ||
+ | |||
+ | ''Test auf unabhängkeit zweier Merkmale:'' | ||
+ | |||
+ | https://ibb.co/8bxmnBP | ||
+ | |||
+ | https://ibb.co/TMMYFtL | ||
+ | |||
+ | https://ibb.co/8X6rSF1 | ||
+ | |||
+ | https://ibb.co/0MRKk84 | ||
+ | |||
+ | ''Test auf Verteilung eines Merkmals:'' | ||
+ | |||
+ | https://ibb.co/wgkDCPk | ||
+ | |||
+ | https://ibb.co/6HxXMKp | ||
+ | |||
+ | https://ibb.co/VwV9sm7 | ||
+ | |||
+ | https://ibb.co/Dp1QqXF | ||
+ | |||
+ | ---- | ||
+ | |||
+ | '''Voraussetzungen:''' | ||
− | |||
Es gibt allerdings auch einige Voraussetzungen und Regeln, die erfüllt sein müssen, damit man den χ²-Test berechnen darf: | Es gibt allerdings auch einige Voraussetzungen und Regeln, die erfüllt sein müssen, damit man den χ²-Test berechnen darf: | ||
1. Die erwarteten Häufigkeiten in jeder Zelle müssen größer als 5 sein. | 1. Die erwarteten Häufigkeiten in jeder Zelle müssen größer als 5 sein. | ||
+ | |||
2. Der χ²-Test darf nur auf Häufigkeiten angewendet werden, niemals auf relative Werte, wie beispielsweise Prozentangaben. | 2. Der χ²-Test darf nur auf Häufigkeiten angewendet werden, niemals auf relative Werte, wie beispielsweise Prozentangaben. | ||
+ | |||
3. Die Stichprobe ist zufällig entnommen worden. | 3. Die Stichprobe ist zufällig entnommen worden. | ||
+ | |||
+ | ---- | ||
+ | |||
+ | '''Wozu dient der Test?''' | ||
+ | |||
+ | '''-'''Signifikanztest, der eingesetzt wird, um zwei nominal oder ordinal skalierte Variablen anhand der beobachteten Häufigkeiten ihrer Merkmalsausprägungen zu analysieren | ||
+ | |||
+ | '''-'''Der Test findet unter anderem Anwendung, wenn überprüft werden soll, ob zwei Variablen voneinander unabhängig sind |
Aktuelle Version vom 16. April 2020, 14:18 Uhr
- Chi-Quadrat-Tests gehören zu den einfachsten Verfahren der Inferenzstatistik.
- Es werden dabei Häufigkeiten ausgewertet.
- Das Verfahren ist für nominal-skalierte Daten geeignet
- Chi-Quadrat-Tests prüfen die Verteilung von Häufigkeiten gegenüber erwarteten Häufigkeiten
Beispiele:
Test auf Unabhängigkeit zweier Merkmale: Ist der Anteil der Brillenträger bei Männern und Frauen gleich?
Test für ein Merkmal: Wird eine von drei Apfelsorten häufiger gekauft als die anderen?
Test einer Verteilung: Ist die Bearbeitungszeit für eine Testaufgabe normalverteilt?
Test zur Verteilung eines Merkmals:
-Allgemein: Test zum Vergleich von Häufigkeiten einer nominalen Klassifikation
-Hypothesen: Nullhypothese und Alternativhypothese
-Häufigkeiten: Beobachtete Häufigkeiten und Erwartete Häufigkeiten
Erwartete Häufigkeit für die Unabhängigkeit von zwei Merkmalen:
Falls die Nullhypothese gilt, falls also die Merkmale unabhängig sind, erwarten wir diese Häufigkeiten.
Erwartete Häufigkeit = (Zeilensumme*Spaltensumme)/Gesammtsumme
Prüfgröße:
Die Prüfgröße ist ein Maß dafür, wie stark die beobachteten Häufigkeiten von den erwarteten Häufigkeiten abweichen
Formel: https://ibb.co/F5zwYZF
Berechnungen in R:
Test auf unabhängkeit zweier Merkmale:
Test auf Verteilung eines Merkmals:
Voraussetzungen:
Es gibt allerdings auch einige Voraussetzungen und Regeln, die erfüllt sein müssen, damit man den χ²-Test berechnen darf:
1. Die erwarteten Häufigkeiten in jeder Zelle müssen größer als 5 sein.
2. Der χ²-Test darf nur auf Häufigkeiten angewendet werden, niemals auf relative Werte, wie beispielsweise Prozentangaben.
3. Die Stichprobe ist zufällig entnommen worden.
Wozu dient der Test?
-Signifikanztest, der eingesetzt wird, um zwei nominal oder ordinal skalierte Variablen anhand der beobachteten Häufigkeiten ihrer Merkmalsausprägungen zu analysieren
-Der Test findet unter anderem Anwendung, wenn überprüft werden soll, ob zwei Variablen voneinander unabhängig sind