Chi-Quadrat-Test: Unterschied zwischen den Versionen

Aus Statistik-Wiki
Wechseln zu: Navigation, Suche
 
(14 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
  
 +
'''-''' Chi-Quadrat-Tests gehören zu den einfachsten Verfahren der Inferenzstatistik.
  
 +
'''-''' Es werden dabei Häufigkeiten ausgewertet.
  
 +
'''-''' Das Verfahren ist für nominal-skalierte Daten geeignet
 +
 +
'''-''' Chi-Quadrat-Tests prüfen die Verteilung von Häufigkeiten gegenüber erwarteten Häufigkeiten
 +
 +
----
 +
 +
'''Beispiele:'''
 +
 +
''Test auf Unabhängigkeit zweier Merkmale'': Ist der Anteil der Brillenträger bei Männern und Frauen gleich?
 +
 +
''Test für ein Merkmal'': Wird eine von drei Apfelsorten häufiger gekauft als die anderen?
 +
 +
''Test einer Verteilung'': Ist die Bearbeitungszeit für eine Testaufgabe normalverteilt?
 +
 +
''Test zur Verteilung eines Merkmals'':
 +
 +
-Allgemein: Test zum Vergleich von Häufigkeiten einer nominalen Klassifikation 
 +
 +
-Hypothesen: Nullhypothese und Alternativhypothese 
 +
 +
-Häufigkeiten: Beobachtete Häufigkeiten und Erwartete Häufigkeiten
 +
 +
'''Erwartete Häufigkeit für die Unabhängigkeit von zwei Merkmalen:'''
 +
 +
Falls die Nullhypothese gilt, falls also die Merkmale unabhängig sind, erwarten wir diese Häufigkeiten.
 +
 +
Erwartete Häufigkeit = (Zeilensumme*Spaltensumme)/Gesammtsumme
 +
 +
'''Prüfgröße:'''
 +
 +
Die Prüfgröße ist ein Maß dafür, wie stark die beobachteten Häufigkeiten von den erwarteten Häufigkeiten abweichen
 +
 +
''Formel:''
 +
https://ibb.co/F5zwYZF
 +
 +
----
 +
 +
'''Berechnungen in R:'''
 +
 +
''Test auf unabhängkeit zweier Merkmale:''
 +
 +
https://ibb.co/8bxmnBP
 +
 +
https://ibb.co/TMMYFtL
 +
 +
https://ibb.co/8X6rSF1
 +
 +
https://ibb.co/0MRKk84
 +
 +
''Test auf Verteilung eines Merkmals:''
 +
 +
https://ibb.co/wgkDCPk
 +
 +
https://ibb.co/6HxXMKp
 +
 +
https://ibb.co/VwV9sm7
 +
 +
https://ibb.co/Dp1QqXF
 +
 +
----
 +
 +
'''Voraussetzungen:'''
  
3 '''Voraussetzungen'''
 
 
Es gibt allerdings auch einige Voraussetzungen und Regeln, die erfüllt sein müssen, damit man den χ²-Test berechnen darf:
 
Es gibt allerdings auch einige Voraussetzungen und Regeln, die erfüllt sein müssen, damit man den χ²-Test berechnen darf:
  
 
1. Die erwarteten Häufigkeiten in jeder Zelle müssen größer als 5 sein.
 
1. Die erwarteten Häufigkeiten in jeder Zelle müssen größer als 5 sein.
 +
 
2. Der χ²-Test darf nur auf Häufigkeiten angewendet werden, niemals auf relative Werte, wie beispielsweise Prozentangaben.
 
2. Der χ²-Test darf nur auf Häufigkeiten angewendet werden, niemals auf relative Werte, wie beispielsweise Prozentangaben.
 +
 
3. Die Stichprobe ist zufällig entnommen worden.
 
3. Die Stichprobe ist zufällig entnommen worden.
  
Wozu dient der Test?  
+
----
 +
 
 +
'''Wozu dient der Test?'''
 +
 
 +
'''-'''Signifikanztest, der eingesetzt wird, um zwei nominal oder ordinal skalierte Variablen anhand der beobachteten Häufigkeiten ihrer Merkmalsausprägungen zu analysieren
  
-Signifikanztest, der eingesetzt wird, um zwei nominal oder ordinal skalierte Variablen anhand der beobachteten Häufigkeiten ihrer Merkmalsausprägungen zu analysieren
+
'''-'''Der Test findet unter anderem Anwendung, wenn überprüft werden soll, ob zwei Variablen voneinander unabhängig sind
-Der Test findet unter anderem Anwendung, wenn überprüft werden soll, ob zwei Variablen voneinander unabhängig sind
 

Aktuelle Version vom 16. April 2020, 14:18 Uhr

- Chi-Quadrat-Tests gehören zu den einfachsten Verfahren der Inferenzstatistik.

- Es werden dabei Häufigkeiten ausgewertet.

- Das Verfahren ist für nominal-skalierte Daten geeignet

- Chi-Quadrat-Tests prüfen die Verteilung von Häufigkeiten gegenüber erwarteten Häufigkeiten


Beispiele:

Test auf Unabhängigkeit zweier Merkmale: Ist der Anteil der Brillenträger bei Männern und Frauen gleich?

Test für ein Merkmal: Wird eine von drei Apfelsorten häufiger gekauft als die anderen?

Test einer Verteilung: Ist die Bearbeitungszeit für eine Testaufgabe normalverteilt?

Test zur Verteilung eines Merkmals:

-Allgemein: Test zum Vergleich von Häufigkeiten einer nominalen Klassifikation

-Hypothesen: Nullhypothese und Alternativhypothese

-Häufigkeiten: Beobachtete Häufigkeiten und Erwartete Häufigkeiten

Erwartete Häufigkeit für die Unabhängigkeit von zwei Merkmalen:

Falls die Nullhypothese gilt, falls also die Merkmale unabhängig sind, erwarten wir diese Häufigkeiten.

Erwartete Häufigkeit = (Zeilensumme*Spaltensumme)/Gesammtsumme

Prüfgröße:

Die Prüfgröße ist ein Maß dafür, wie stark die beobachteten Häufigkeiten von den erwarteten Häufigkeiten abweichen

Formel: https://ibb.co/F5zwYZF


Berechnungen in R:

Test auf unabhängkeit zweier Merkmale:

https://ibb.co/8bxmnBP

https://ibb.co/TMMYFtL

https://ibb.co/8X6rSF1

https://ibb.co/0MRKk84

Test auf Verteilung eines Merkmals:

https://ibb.co/wgkDCPk

https://ibb.co/6HxXMKp

https://ibb.co/VwV9sm7

https://ibb.co/Dp1QqXF


Voraussetzungen:

Es gibt allerdings auch einige Voraussetzungen und Regeln, die erfüllt sein müssen, damit man den χ²-Test berechnen darf:

1. Die erwarteten Häufigkeiten in jeder Zelle müssen größer als 5 sein.

2. Der χ²-Test darf nur auf Häufigkeiten angewendet werden, niemals auf relative Werte, wie beispielsweise Prozentangaben.

3. Die Stichprobe ist zufällig entnommen worden.


Wozu dient der Test?

-Signifikanztest, der eingesetzt wird, um zwei nominal oder ordinal skalierte Variablen anhand der beobachteten Häufigkeiten ihrer Merkmalsausprägungen zu analysieren

-Der Test findet unter anderem Anwendung, wenn überprüft werden soll, ob zwei Variablen voneinander unabhängig sind