Chi-Quadrat-Test

Aus Statistik-Wiki
Wechseln zu: Navigation, Suche

- Chi-Quadrat-Tests gehören zu den einfachsten Verfahren der Inferenzstatistik.

- Es werden dabei Häufigkeiten ausgewertet.

- Das Verfahren ist für nominal-skalierte Daten geeignet

- Chi-Quadrat-Tests prüfen die Verteilung von Häufigkeiten gegenüber erwarteten Häufigkeiten


Beispiele:

Test auf Unabhängigkeit zweier Merkmale: Ist der Anteil der Brillenträger bei Männern und Frauen gleich?

Test für ein Merkmal: Wird eine von drei Apfelsorten häufiger gekauft als die anderen?

Test einer Verteilung: Ist die Bearbeitungszeit für eine Testaufgabe normalverteilt?

Test zur Verteilung eines Merkmals:

-Allgemein: Test zum Vergleich von Häufigkeiten einer nominalen Klassifikation

-Hypothesen: Nullhypothese und Alternativhypothese

-Häufigkeiten: Beobachtete Häufigkeiten und Erwartete Häufigkeiten

Erwartete Häufigkeit für die Unabhängigkeit von zwei Merkmalen:

Falls die Nullhypothese gilt, falls also die Merkmale unabhängig sind, erwarten wir diese Häufigkeiten.

Erwartete Häufigkeit = (Zeilensumme*Spaltensumme)/Gesammtsumme

Prüfgröße:

Die Prüfgröße ist ein Maß dafür, wie stark die beobachteten Häufigkeiten von den erwarteten Häufigkeiten abweichen

Formel: https://ibb.co/F5zwYZF


Berechnungen in R:

Test auf unabhängkeit zweier Merkmale:

https://ibb.co/8bxmnBP

https://ibb.co/TMMYFtL

https://ibb.co/8X6rSF1

https://ibb.co/0MRKk84

Test auf Verteilung eines Merkmals:

https://ibb.co/wgkDCPk

https://ibb.co/6HxXMKp

https://ibb.co/VwV9sm7

https://ibb.co/Dp1QqXF


Voraussetzungen:

Es gibt allerdings auch einige Voraussetzungen und Regeln, die erfüllt sein müssen, damit man den χ²-Test berechnen darf:

1. Die erwarteten Häufigkeiten in jeder Zelle müssen größer als 5 sein.

2. Der χ²-Test darf nur auf Häufigkeiten angewendet werden, niemals auf relative Werte, wie beispielsweise Prozentangaben.

3. Die Stichprobe ist zufällig entnommen worden.


Wozu dient der Test?

-Signifikanztest, der eingesetzt wird, um zwei nominal oder ordinal skalierte Variablen anhand der beobachteten Häufigkeiten ihrer Merkmalsausprägungen zu analysieren

-Der Test findet unter anderem Anwendung, wenn überprüft werden soll, ob zwei Variablen voneinander unabhängig sind