Chi-Quadrat-Test

Mit Chi-Quadrat-Test (χ²-Test) bezeichnet man in der mathematischen Statistik eine Gruppe von Hypothesentests mit χ²-verteilter Testprüfgröße.

Man unterscheidet vor allem die folgenden Tests:

Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine bestimmte Weise verteilt sind.
Unabhängigkeitstest: Hier wird geprüft, ob zwei Merkmale stochastisch unabhängig sind.
Homogenitätstest: Hier wird geprüft, ob zwei oder mehr Stichproben derselben Verteilung bzw. einer homogenen Grundgesamtheit entstammen.

Der Chi-Quadrat-Test und seine Teststatistik wurde erstmals von Karl Pearson beschrieben.^[1]

Verteilungstest

Man betrachtet ein statistisches Merkmal $X$ , dessen Wahrscheinlichkeiten in der Grundgesamtheit unbekannt sind. Es wird bezüglich der Wahrscheinlichkeiten von $X$ eine vorläufig allgemein formulierte Nullhypothese

$H_0\,$ : Das Merkmal

X

besitzt die Wahrscheinlichkeitsverteilung

F 0 (x)

aufgestellt.

Vorgehensweise

Die n Beobachtungen $x_1,\dots,x_n$ des Merkmals X liegen in m verschiedenen Kategorien $j, j = 1,\ldots,m$ , vor. Treten bei einem Merkmal sehr viele Ausprägungen auf, fasst man sie zweckmäßigerweise in $m$ Klassen zusammen und fasst die Klassenzugehörigkeit als $j$ -te Kategorie auf. Die Zahl der Beobachtungen in einer Kategorie ist die beobachtete Häufigkeit $n j$ .

Man überlegt sich nun, wie viele Beobachtungen im Mittel in einer Kategorie liegen müssten, wenn $X$ tatsächlich die hypothetische Verteilung besitzt. Dazu berechnet man zunächst die Wahrscheinlichkeit $p o j$ , dass eine Ausprägung von $X$ in die Kategorie j fällt.

$n_{jo}=p_{oj}\cdot n$

ist die unter $H 0$ zu erwartende Häufigkeit. Wenn die in der vorliegenden Stichprobe beobachteten Häufigkeiten $n j$ "zu stark" von den erwarteten Häufigkeiten abweichen, wird die Nullhypothese abgelehnt.

Die Prüfgröße für den Test

$\chi ^2= \sum_{j=1}^m \frac{(n_j-n_{jo})^2}{n_{jo}}$ ,

misst die Größe der Abweichung.

Die Prüfgröße χ² ist bei ausreichend großen n_j annähernd Chi-Quadrat-verteilt mit m-1 Freiheitsgraden.

Wenn die Nullhypothese wahr ist, sollte der Unterschied zwischen der beobachteten und der theoretisch erwarteten Häufigkeit klein sein. Also wird H₀ bei einem hohen Prüfgrößenwert abgelehnt. Der Ablehnungsbereich für H₀ liegt rechts.

Bei einem Signifikanzniveau α wird H₀ abgelehnt, wenn χ² > χ²_{(1-α; m-1)} gilt, wenn also der aus der Stichprobe erhaltene Wert der Prüfgröße größer als das (1-α)-Quantil der χ²-Verteilung mit m-1 Freiheitsgraden ist.

Es existieren Tabellen der χ²-Quantile ("kritische Werte") in Abhängigkeit von der Anzahl der Freiheitsgrade und vom gewünschten Signifikanzniveau, z. B. [1] oder (knapper) [2].

Soll das Signifikanzniveau, das zu einem bestimmten χ²-Wert gehört, bestimmt werden, so muss in der Regel aus der Tabelle ein Zwischenwert berechnet werden. Dazu verwendet man logarithmische Interpolation.

Besonderheiten

Schätzung von Verteilungsparametern

Im Allgemeinen gibt man bei der Verteilungshypothese die Parameter der Verteilung an. Kann man diese nicht angeben, müssen sie aus der Stichprobe geschätzt werden. Hier geht bei der χ²-Verteilung pro geschätztem Parameter ein Freiheitsgrad verloren. Sie hat also m-w-1 Freiheitsgrade mit w als Zahl der geschätzten Parameter. Für die Normalverteilung wäre w=2, wenn der Erwartungswert μ und die Varianz σ² abgeschätzt werden.

Mindestgröße der erwarteten Häufigkeiten

Damit die Prüfgröße als annähernd χ²-verteilt betrachtet werden kann, muss jede erwartete Häufigkeit eine gewisse Mindestgröße betragen. Verschiedene Lehrwerke setzen diese bei 1 oder 5 an. Ist die erwartete Häufigkeit zu klein, können gegebenenfalls mehrere Klassen zusammengefasst werden, um die Mindestgröße zu erreichen.

Beispiel zu Anpassungstest

Es liegen von ca. 200 börsennotierten Unternehmen die Umsätze vor. Das folgende Histogramm zeigt ihre Verteilung.

Es sei $X$ der Umsatz eines Unternehmens [Mio. €].

Es soll nun die Hypothese getestet werden, dass $X$ normalverteilt ist.

Da die Daten in vielen verschiedenen Ausprägungen vorliegen, wurden sie in Klassen eingeteilt. Es ergab sich die Tabelle:

Klasse	Intervall		Beobachtete Häufigkeit
j	über	bis	n_j
1	…	0	0
2	0	5000	148
3	5000	10000	17
4	10000	15000	5
5	15000	20000	8
6	20000	25000	4
7	25000	30000	3
8	30000	35000	3
9	35000	...	9
Summe			197

Da keine Parameter vorgegeben werden, werden sie aus der Stichprobe ermittelt. Es sind geschätzt

$\hat \mu = \bar x = 6892$

und

$\hat \sigma = s = 14984$ .

Es wird getestet:

H₀: X ist normalverteilt mit dem Erwartungswert μ = 6892 und der Varianz σ² = 14984².

Um die erwarteten Häufigkeiten zu bestimmen, werden zunächst die Wahrscheinlichkeiten berechnet, dass X in die vorgegebenen Klassen fällt. Es sei Φ(x|6892;14984²) die Verteilungsfunktion der oben angegebenen Normalverteilung an der Stelle x. Man errechnet dann

$P(X \le 0) = F_{1o} = \Phi\left(0\mid 6892; 14984^2\right) = 0{,}3228$

$P(0 < X \le 5000) = \Phi\left(5000\mid 6892;14984^2\right) - \Phi\left(0\mid 6892;14984^2\right) = 0{,}1270$

…

Daraus ergeben sich die erwarteten Häufigkeiten

$n_{1o} = n \cdot F_{1o} = 197 \cdot 0{,}3228 = 63{,}59$

$n_{2o} = 197 \cdot 0{,}1270 = 25{,}02$

…

Es müssten also beispielsweise ca. 25 Unternehmen im Mittel einen Umsatz zwischen 0 € und 5000 € haben, wenn das Merkmal Umsatz tatsächlich normalverteilt ist.

Die erwarteten Häufigkeiten sind zusammen mit den beobachteten Häufigkeiten in der folgenden Tabelle aufgeführt.

Klasse	Intervall		Beobachtete Häufigkeit	Wahrscheinlichkeit	Erwartete Häufigkeit
j	über	bis	n_j	F_jo	n_jo
1	…	0	0	0,3228	63,59
2	0	5000	148	0,1270	25,02
3	5000	10000	17	0,1324	26,08
4	10000	15000	5	0,1236	24,35
5	15000	20000	8	0,1034	20,36
6	20000	25000	4	0,0774	15,25
7	25000	30000	3	0,0519	10,23
8	30000	35000	3	0,0312	6,14
9	35000	…	9	0,0303	5,98
Summe			197	1,0000	197,00

Die Prüfgröße wird jetzt folgendermaßen ermittelt:

$\chi^2 = \frac{(0- 63,59)^2}{63{,}59} + \frac{(148 - 25{,}02)^2}{25{,}02} + \dotsb + \frac{(9 - 5{,}98)^2}{5{,}98} = 710{,}79 .$

Bei einem Signifikanzniveau α = 0,05 liegt der kritische Wert der Testprüfgröße bei χ²(0,95;9-3=6) = 12,59. Da χ² > 12,59, wird die Nullhypothese abgelehnt. Man kann davon ausgehen, dass das Merkmal Umsatz in der Grundgesamtheit nicht normalverteilt ist.

Ergänzung

Die obigen Daten wurden in der Folge logarithmiert. Aufgrund des Ergebnisses des Tests des Datensatzes der logarithmierten Daten auf Normalverteilung konnte auf einem Signifikanzniveau von 0,05 die Nullhypothese der Normalverteilung der Daten nicht verworfen werden. Unter der Voraussetzung, dass die logarithmierten Umsatzdaten tatsächlich einer Normalverteilung entstammen, sind die ursprünglichen Umsatzdaten logarithmisch normalverteilt.

Das folgende Histogramm zeigt die Verteilung der logarithmierten Daten.

Unabhängigkeitstest

Der Unabhängigkeitstest ist ein Signifikanztest auf Unabhängigkeit in der Kontingenztafel.

Man betrachtet zwei statistische Merkmale $X$ und $Y$ , die beliebig skaliert sein können. Man interessiert sich dafür, ob die Merkmale stochastisch unabhängig sind. Es wird die Nullhypothese

H₀: Die Merkmale

X

und

Y

sind stochastisch unabhängig.

aufgestellt.

Vorgehensweise

Die Beobachtungen von $X$ liegen in m Kategorien j (j = 1, …, m) vor, die des Merkmals $Y$ in r Kategorien k (k = 1, …, r). Treten bei einem Merkmal sehr viele Ausprägungen auf, fasst man sie zweckmäßigerweise zu Klassen j zusammen und fasst die Klassenzugehörigkeit als j-te Kategorie auf. Es gibt insgesamt n paarweise Beobachtungen von $X$ und $Y$ , die sich auf $m \times r$ Kategorien verteilen.

Konzeptionell ist der Test so aufzufassen:

Man betrachte zwei diskrete Zufallsvariablen $X$ und $Y$ , deren gemeinsame Wahrscheinlichkeiten in einer Wahrscheinlichkeitstabelle dargestellt werden können.

Man zählt nun, wie oft die j-te Ausprägung von $X$ zusammen mit der k-ten Ausprägung von $Y$ auftritt. Die beobachteten gemeinsamen absoluten Häufigkeiten n_jk können in einer zweidimensionalen Häufigkeitstabelle mit m Zeilen und r Spalten eingetragen werden.

	Merkmal $Y$						Summe Σ
Merkmal $X$	1	2	…	k	…	r	n_j.
1	n₁₁	n₁₂	...	n_1k	...	n_1r	n_1.
2	n₂₁	n₂₂	…	n_2k	…	n_2r	n_2.
…	…	…	…	…	…	…	…
j	…	…	…	n_jk	…	…	n_j.
…	…	…	…	…	…	…	…
m	n_m1	n_m2	…	n_mk	…	n_mr	n_m.
Summe Σ	n_.1	n_.2	…	n_.k	…	n_.r	n

Die Zeilen- bzw. Spaltensummen ergeben die absoluten Randhäufigkeiten n_j. bzw. n_.k als

$n_{j\,\cdot }= \sum_{k=1}^r n_{jk}$ und $n_{\cdot\, k}= \sum_{j=1}^m n_{jk}$

Entsprechend sind die gemeinsamen relativen Häufigkeiten p_jk = n_jk/n und die relativen Randhäufigkeiten p_j. = n_j./n und p._k = n._k/n .

Wahrscheinlichkeitstheoretisch gilt: Sind zwei Ereignisse A und B stochastisch unabhängig, ist die Wahrscheinlichkeit für ihr gemeinsames Auftreten gleich dem Produkt der Einzelwahrscheinlichkeiten:

$P(A\cap B)= P(A)\cdot P(B)$

Man überlegt sich nun, dass analog zu oben bei stochastischer Unabhängigkeit von $X$ und $Y$ auch gelten müsste

$p_{jk}\approx p_{j\,\cdot}\cdot p_{\cdot\, k}$ ,

mit n multipliziert entsprechend

$n_{jk}\approx \frac{n_{j\,\cdot}\cdot n_{\cdot\,k}}{n}$ oder auch

$n_{jk} - \frac{n_{j\,\cdot}\cdot n_{\cdot \,k}}{n}\approx 0$ .

Sind diese Differenzen für sämtliche j, k klein, kann man vermuten, dass $X$ und $Y$ tatsächlich stochastisch unabhängig sind.

Setzt man für die erwartete Häufigkeit bei Vorliegen von Unabhängigkeit

$n^*_{jk}=\frac{n_{j\,\cdot}\cdot n_{\cdot \,k}}{n}$

resultiert aus der obigen Überlegung die Prüfgröße für den Unabhängigkeitstest

$\chi ^2= \sum_{j=1}^m\sum_{k=1}^r \frac{(n_{jk}- n^*_{jk})^2}{n^*_{jk}}$ .

Die Prüfgröße χ² ist bei ausreichend großen erwarteten Häufigkeiten n_jk* annähernd χ²-verteilt mit (m-1)(r-1) Freiheitsgraden.

Wenn die Prüfgröße klein ist, wird vermutet, dass die Hypothese wahr ist. Also wird H₀ bei einem hohen Prüfgrößenwert abgelehnt, der Ablehnungsbereich für H₀ liegt rechts.

Bei einem Signifikanzniveau α wird H₀ abgelehnt, wenn χ² > χ²(1-α; (m-1)(r-1)), dem (1-α)-Quantil der χ²-Verteilung mit (m-1)(r-1) Freiheitsgraden ist.

Besonderheiten

Damit die Prüfgröße als annähernd χ²-verteilt betrachtet werden kann, muss jede erwartete Häufigkeit $n_{jk}^*$ eine gewisse Mindestgröße haben. Verschiedene Lehrwerke setzen diese bei 1 oder 5 an. Ist die erwartete Häufigkeit zu klein, können gegebenenfalls mehrere Klassen zusammengefasst werden, um die Mindestgröße zu erreichen.

Alternativ kann die Stichprobenverteilung der Teststatistik auf Basis der gegebenen Randverteilungen und der Annahme der Unabhängigkeit der Merkmale per Bootstrap untersucht werden.

Beispiel zum Unabhängigkeitstest

Im Rahmen des Qualitätsmanagements wurden die Kunden einer Bank befragt, unter anderem nach ihrer Zufriedenheit mit der Geschäftsabwicklung und nach der Gesamtzufriedenheit. Der Grad der Zufriedenheit richtete sich nach dem Schulnotensystem.

Aus den Daten ergibt sich die folgende Kreuztabelle der Gesamtzufriedenheit von Bankkunden versus ihrer Zufriedenheit mit der Geschäftsabwicklung. Man sieht, dass einige erwartete Häufigkeiten zu klein waren.

Eine Reduzierung der Kategorien auf jeweils drei ergab methodisch korrekte Ergebnisse.

Die folgende Tabelle enthält die erwarteten Häufigkeiten n_jk*, die sich so berechnen:

$n^*_{11}= \frac{102 \cdot 270}{621} = 44{,}35 \quad n^*_{12} = \frac{102 \cdot 273}{621}= 44{,}84 \quad \dotsb \quad n^*_{33}= \frac{160 \cdot 78}{621} = 20{,}10$

	Merkmal $Y$
Merkmal $X$	1	2	3	Σ
1	44,35	44,84	12,81	102
2	156,09	157,82	45,09	359
3	69,57	70,34	20,10	160
Σ	270	273	78	621

Die Prüfgröße wird dann folgendermaßen ermittelt:

$\chi^2 = \frac{(86 - 44{,}35)^2}{44{,}35} + \frac{(16 - 44{,}84)^2}{44{,}84} + \dotsb + \frac{(53 - 20{,}10)^2}{20{,}10} = 167{,}187$

Bei einem α = 0,05 liegt der kritische Wert der Testprüfgröße bei χ²(0,95; 4) = 9,488. Da χ² > 9,488 ist, wird die Hypothese signifikant abgelehnt, man vermutet also, dass die Zufriedenheit mit der Geschäftsabwicklung und die Gesamtzufriedenheit assoziiert sind.

Homogenitätstest

Mit dem Chi-Quadrat-Homogenitätstest kann anhand der zugehörigen Stichprobenverteilungen geprüft werden, ob $m \geq 2$ (unabhängige) Zufallsstichproben diskreter Merkmale $X_1,\ldots,X_m$ mit den Stichprobenumfängen $n_1,\ldots,n_m$ aus identisch verteilten (also homogenen) Grundgesamtheiten stammen. Damit ist er eine Hilfe bei der Entscheidung darüber, ob mehrere Stichproben derselben Grundgesamtheit bzw. Verteilung entstammen bzw. bei der Entscheidung, ob ein Merkmal in verschiedenen Grundgesamtheiten (z.B. Männer und Frauen) auf die gleiche Art verteilt ist. Der Test ist wie die anderen Chi-Quadrat-Tests auf jedem Skalenniveau anwendbar.^[2]^[3]

Die Hypothesen lauten:

$H_0\,$ :	$F_1(x_1)=F_2(x_2)=\dotsb=F_k(x_m)$	Die unabhängigen Stichproben $X_1,\ldots,X_m$ stammen aus identisch verteilten Grundgesamtheiten.
$H_1\,$ :	$F_i(x_i) \neq F_j(x_j)$ für min. ein $i \neq j$	Mindestens zwei Stichproben $X_i,X_j\,$ stammen aus unterschiedlich verteilten Grundgesamtheiten.

Vorgehensweise

Die untersuchte Zufallsvariable (das Merkmal), z.B. Antwort auf "die Sonntagsfrage", sei k-fach gestuft, d.h. es gibt k Merkmalskategorien (das Merkmal besitzt k Ausprägungen), z.B. SPD, CDU, B90/Grüne, FDP, Die Linke und Andere (d.h. k=6). Die Stichproben $X_i\,$ können z.B. die Umfrageergebnisse verschiedener Meinungsforschungsinstitute sein. Von Interesse könnte dann sein, zu prüfen, ob sich die Umfrageergebnisse signifikant unterscheiden.

Die beobachteten Häufigkeiten je Stichprobe (Umfrage) und Merkmalskategorie (genannte Partei) $n_{ij}\,$ werden in eine entsprechende $m\times k$ -Kreuztabelle eingetragen (hier 3x3):

Stichprobe $X i$	Kategorie 1	Kategorie 2	Kategorie 3	Summe
	Merkmalskategorie $j\,$
$X_1\,$	$n_{11}\,$	$n_{12}\,$	$n_{13}\,$	$n_{11}+n_{12}+n_{13}=n_{1\bullet}$
$X_2\,$	$n_{21}\,$	$n_{22}\,$	$n_{23}\,$	$n_{21}+n_{22}+n_{23}=n_{2\bullet}$
$X_3\,$	$n_{31}\,$	$n_{32}\,$	$n_{33}\,$	$n_{31}+n_{32}+n_{33}=n_{3\bullet}$
Summe	$n_{11}+n_{21}+n_{31}=n_{\bullet 1}$	$n_{12}+n_{22}+n_{32}=n_{\bullet 2}$	$n_{13}+n_{23}+n_{33}=n_{\bullet 3}$	$n\,$

Untersucht werden nun die Abweichungen zwischen den beobachteten (empirischen) Häufigkeits- bzw. Wahrscheinlichkeitsverteilungen der Stichproben über die Kategorien des Merkmals. Die beobachteten Zellhäufigkeiten $n_{ij}\,$ werden mit den Häufigkeiten verglichen, die bei Gültigkeit der Nullhypothese zu erwarten wären.

Aus den Randverteilungen werden die unter Gültigkeit der Nullhypothese einer homogenen Grundgesamtheit erwarteten Zellhäufigkeiten bestimmt:

$E_{ij}=\frac{n_{i \bullet} n_{\bullet j}}{n}$

bezeichnet die erwartete Anzahl von Beobachtungen (absolute Häufigkeit) von Stichprobe i in Kategorie j.

Anhand der so errechneten Größen wird folgende approximativ Chi-Quadrat-verteilte Prüfgröße berechnet:

$\chi^2=\sum_{j=1}^k \sum_{i=1}^m \frac{(n_{ij}-E_{ij})^2}{E_{ij}}$

Um zu einer Testentscheidung zu gelangen, wird der erhaltene Wert der Prüfgröße mit dem zugehörigen kritischen Wert verglichen, d.h. mit dem von der Anzahl der Freiheitsgrade und dem Signifikanzniveau $\alpha \,$ abhängigen Quantil der Chi-Quadrat-Verteilung (alternativ kann der p-Wert bestimmt werden). Sind die Abweichungen zwischen mindestens zwei Stichprobenverteilungen signifikant, wird die Nullhypothese verworfen, d.h. die Nullhypothese der Homogenität wird abgelehnt, falls

$\chi^2 > \chi^2_{(k-1)(m-1);1-\alpha}$ .

Der Ablehnungsbereich für H₀ liegt rechts vom kritischen Wert.

Anwendungsbedingungen

Damit die Prüfgröße als näherungsweise (approximativ) $\chi^2 \,$ -verteilt betrachtet werden kann, müssen folgende Approximationsbedingungen gelten:^[2]^[4]

"großer" Stichprobenumfang ( $n > 30$ )
$E_{ij} \geq 1$ für alle $i, j$
min. 80% der $E_{ij} > 5\,$
Rinne (2003) und Voß (2000) fordern zusätzlich Zellhäufigkeiten $n_{ij} \geq 10$ ^[2]^[4]

Sind einige erwartete Häufigkeiten zu klein, müssen mehrere Klassen bzw. Merkmalskategorien zusammengefasst werden, um die Approximationsbedingungen einzuhalten.

Besitzt die untersuchte Zufallsvariable sehr viele (mögliche) Ausprägungen, z.B. weil die Variable metrisch stetig ist, fasst man diese zweckmäßigerweise in $m$ Klassen (=Kategorien) zusammen, um die nun klassierte Zufallsvariable mit dem Chi-Quadrat-Test untersuchen zu können. Hierbei ist jedoch zu beachten, dass die Art und Weise der Klassierung der Beobachtungen das Testergebnis beeinflussen kann.^[4]

Vergleich zu Unabhängigkeits- und Anpassungstest

Der Homogenitätstest kann auch als Unabhängigkeitstest interpretiert werden, wenn man die Stichproben als Ausprägungen eines zweiten Merkmals ansieht. Auch kann er als eine Form des Anpassungstests angesehen werden, bei der nicht eine empirische und eine theoretische Verteilung, sondern mehrere empirische Verteilungen verglichen werden. Unabhängigkeitstest und Anpassungstest sind jedoch Einstichprobenprobleme, während der Homogenitätstest ein Mehrstichprobenproblem darstellt. Beim Unabhängigkeitstest wird eine einzige Stichprobe bzgl. zweier Merkmale erhoben, beim Anpassungstest eine Stichprobe bzgl. einem Merkmal. Beim Homogenitätstest werden mehrere Stichproben bzgl. eines Merkmals erhoben.

Vierfeldertest

Der Chi-Quadrat-Vierfeldertest ist ein statistischer Test. Er dient dazu, zu prüfen, ob zwei dichotome Merkmale stochastisch unabhängig voneinander sind bzw. ob die Verteilung eines dichotomen Merkmals in zwei Gruppen identisch ist.^[5]

Vorgehensweise

Der Vierfeldertest beruht auf einer (2x2)-Kontingenztafel, die die (bivariate) Häufigkeitsverteilung zweier Merkmale visualisiert:

Merkmal Y	Ausprägung 1	Ausprägung 2	Zeilensumme
	Merkmal X
Ausprägung 1	a	b	a+b
Ausprägung 2	c	d	c+d
Spaltensumme	a+c	b+d	n = a+b+c+d

Laut einer Faustformel muss der Erwartungswert aller vier Felder mindestens 5 betragen. Der Erwartungswert wird dabei berechnet aus Zeilensumme*Spaltensumme/Gesamtzahl. Bei einem Erwartungswert kleiner 5 empfehlen Statistiker den Exakten Fisher-Test.

Teststatistik

Um die Nullhypothese zu prüfen, dass beide Merkmale stochastisch unabhängig sind, wird zunächst folgende Prüfgröße für einen zweiseitigen Test berechnet:

$\widehat{ \chi^2} = \frac{n \cdot (a\cdot d-c\cdot b)^2}{(a+c)\cdot(b+d)\cdot(a+b)\cdot(c+d)} \; \stackrel{a}{\sim} \; \chi^2_1$ .

Die Prüfgröße ist näherungsweise Chi-Quadrat-verteilt mit einem Freiheitsgrad. Sie sollte nur dann verwendet werden, wenn in jeder der beiden Stichproben mindestens sechs Merkmalsträger (Beobachtungen) enthalten sind.

Testentscheidung

Ist der auf Grund der Stichprobe erhaltene Prüfwert kleiner als der zum gewählten Signifikanzniveau gehörende kritische Wert (d.h. das entsprechende Quantil der Chi-Quadrat-Verteilung), dann konnte der Test nicht nachweisen, dass ein signifikanter Unterschied besteht. Errechnet sich dagegen ein Prüfwert, der größer oder gleich dem kritischen Wert ist, so besteht zwischen den Stichproben ein signifikanter Unterschied.

Die Wahrscheinlichkeit, dass der berechnete (oder ein noch größerer) Prüfwert nur zufällig auf Grund der Stichprobenziehung erhalten wurde (p-Wert), lässt sich wie folgt näherungsweise berechnen:

$p=\frac{1}{2} \cdot 10^\frac{-\widehat{\chi^2}}{3{,}84}$

Die Näherung dieser (Faust-)Formel an den tatsächlichen p-Wert ist gut, wenn die Prüfgröße zwischen 2,0 und 8,0 liegt.^[6]

Beispiele und Anwendungen

Bei der Frage, ob eine medizinische Maßnahme wirksam ist oder nicht, ist der Vierfeldertest sehr hilfreich, da er sich auf das Hauptentscheidungskriterium konzentriert.

Beispiel 1

Man befragt jeweils 50 (zufällig ausgewählte) Frauen und Männer, ob sie rauchen oder nicht.

Man erhält das Ergebnis:

Frauen: 25 Raucher, 25 Nichtraucher
Männer: 30 Raucher, 20 Nichtraucher

Führt man auf Basis dieser Erhebung einen Vierfeldertest durch, dann ergibt sich anhand der oben dargestellten Formel ein Prüfwert von ca. 1. Da dieser Wert kleiner ist als der kritische Wert 3,841, kann die Hypothese, dass das Rauchverhalten vom Geschlecht unabhängig ist, nicht verworfen werden. Der Anteil der Raucher bzw. Nichtraucher unterscheidet sich zwischen den Geschlechtern nicht signifikant.

Beispiel 2

Man befragt jeweils 500 (zufällig ausgewählte) Frauen und Männer, ob sie rauchen oder nicht.

Folgende Daten werden erhalten:

Frauen: 250 Nichtraucher, 250 Raucher
Männer: 300 Nichtraucher, 200 Raucher

Hier ergibt sich anhand des Vierfeldertests ein Prüfwert von $\frac{1000}{99}\approx 10{,}1$ , welcher größer als 3,841 ist. Da $10,1 > 3,841$ , kann die Nullhypothese, dass die Merkmale "Rauchverhalten" und "Geschlecht" stochastisch unabhängig voneinander sind, auf einem Signifikanzniveau von 0,05 abgelehnt werden.

Tabelle der Quantile der Chi-Quadrat-Verteilung

Die Tabelle zeigt die wichtigsten Quantile der Chi-Quadrat-Verteilung. In der linken Spalte sind die Freiheitsgrade und in der oberen Zeile die (1-alpha)-Niveaus eingetragen. Ablesebeispiel: Das Quantil der Chi-Quadrat-Verteilung bei 2 Freiheitsgraden und einem alpha-Niveau von 1% beträgt 9,21.

f	0,900	0,950	0,975	0,990	0,995	0,999
	1-α
1	2,71	3,84	5,02	6,63	7,88	10,83
2	4,61	5,99	7,38	9,21	10,60	13,82
3	6,25	7,81	9,35	11,34	12,84	16,27
4	7,78	9,49	11,14	13,28	14,86	18,47
5	9,24	11,07	12,83	15,09	16,75	20,52
6	10,64	12,59	14,45	16,81	18,55	22,46
7	12,02	14,07	16,01	18,48	20,28	24,32
8	13,36	15,51	17,53	20,09	21,95	26,12
9	14,68	16,92	19,02	21,67	23,59	27,88
10	15,99	18,31	20,48	23,21	25,19	29,59
11	17,28	19,68	21,92	24,72	26,76	31,26
12	18,55	21,03	23,34	26,22	28,30	32,91
13	19,81	22,36	24,74	27,69	29,82	34,53
14	21,06	23,68	26,12	29,14	31,32	36,12
15	22,31	25,00	27,49	30,58	32,80	37,70
16	23,54	26,30	28,85	32,00	34,27	39,25
17	24,77	27,59	30,19	33,41	35,72	40,79
18	25,99	28,87	31,53	34,81	37,16	42,31
19	27,20	30,14	32,85	36,19	38,58	43,82
20	28,41	31,41	34,17	37,57	40,00	45,31
21	29,62	32,67	35,48	38,93	41,40	46,80
22	30,81	33,92	36,78	40,29	42,80	48,27
23	32,01	35,17	38,08	41,64	44,18	49,73
24	33,20	36,42	39,36	42,98	45,56	51,18
25	34,38	37,65	40,65	44,31	46,93	52,62
26	35,56	38,89	41,92	45,64	48,29	54,05
27	36,74	40,11	43,19	46,96	49,64	55,48
28	37,92	41,34	44,46	48,28	50,99	56,89
29	39,09	42,56	45,72	49,59	52,34	58,30
30	40,26	43,77	46,98	50,89	53,67	59,70
40	51,81	55,76	59,34	63,69	66,77	73,40
50	63,17	67,50	71,42	76,15	79,49	86,66
60	74,40	79,08	83,30	88,38	91,95	99,61
70	85,53	90,53	95,02	100,43	104,21	112,32
80	96,58	101,88	106,63	112,33	116,32	124,84
90	107,57	113,15	118,14	124,12	128,30	137,21
100	118,50	124,34	129,56	135,81	140,17	149,45
200	226,02	233,99	241,06	249,45	255,26	267,54
300	331,79	341,40	349,87	359,91	366,84	381,43
400	436,65	447,63	457,31	468,72	476,61	493,13
500	540,93	553,13	563,85	576,49	585,21	603,45

Siehe auch

Weblinks

Exakte p-Werte
Text: Überprüfung eines "gezinkten" Würfels mittels Chi-Quadrat-Tests (PDF-Datei; 367 kB)
Vierfeldertest:
- Wikibooks: Vierfeldertest mit R – Lern- und Lehrmaterialien
- Programmcode in Visual Basic
- Programmcode in Gambas

Einzelnachweise

↑ Karl Pearson: On the criterion that a given system of derivations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. In: The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science. 50, Nr. 5, 1900, S. 157-175.
↑ ^a ^b ^c Horst Rinne: Taschenbuch der Statistik. 3. Auflage. Verlag Harri Deutsch, 2003, S. 562-563.
↑ Bernd Rönz, Hans G. Strohe (1994), Lexikon Statistik, Gabler Verlag, S. 69
↑ ^a ^b ^c Werner Voß: Taschenbuch der Statistik. 1. Auflage. Fachbuchverlag Leipzig, 2000, S. 447.
↑ Jürgen Bortz, Nicola Döring: Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. 4. Auflage. Springer, 2006, S. 103.
↑ Hans-Hermann Dubben, Hans-Peter Beck-Bornholdt: Der Hund, der Eier legt. 4. Auflage. Rowohlt Science, 2009, S. 293.

Kategorie:

Nicht-Parametrischer Test

Wikimedia Foundation.

Игры ⚽ Поможем написать реферат

Schlagen Sie auch in anderen Wörterbüchern nach:

Chi-Quadrat-Test — Chi Quadrat Test, ein häufig angewandtes statistisches Verfahren (Statistik), mit dessen Hilfe z. B. Häufigkeitsunterschiede bei mehrklassigen qualitativen Merkmalen auf Signifikanz geprüft werden können. Mit dem Chi Quadrat Test lässt sich… … Universal-Lexikon
Chi Quadrat Test — Mit dem χ2 Test (Chi Quadrat Test) untersucht man Verteilungseigenschaften einer statistischen Grundgesamtheit. Man unterscheidet vor allem die beiden Tests: Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine… … Deutsch Wikipedia
Chi-Quadrat-Test — ⇡ statistisches Testverfahren; zentrale Anwendung: Prüfung einer Hypothese über die Verteilung eines Merkmals (Anpassungstest), z.B. Prüfung einer Hypothese über die ⇡ Anteilswerte pi (i = 1, ..., k) der Kategorien eines ⇡ qualitativen… … Lexikon der Economics
Chi-Quadrat — (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale in einer… … Deutsch Wikipedia
Chi-Quadrat-Statistik — Chi Quadrat (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale… … Deutsch Wikipedia
Chi Quadrat — (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale in einer… … Deutsch Wikipedia
Chi-Quadrat-Anpassungstest — Mit dem χ2 Test (Chi Quadrat Test) untersucht man Verteilungseigenschaften einer statistischen Grundgesamtheit. Man unterscheidet vor allem die beiden Tests: Verteilungstest oder Anpassungstest: Hier wird geprüft, ob vorliegende Daten auf eine… … Deutsch Wikipedia
Chi-Quadrat-Vierfeldertest — Die Artikel Vierfelderkorrelation und Vierfeldertest überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zu vereinigen. Beteilige dich dazu an der Diskussion über diese Überschneidungen. Bitte entferne diesen… … Deutsch Wikipedia
Chi-Quadrat-Verteilung — stetige theoretische ⇡ Verteilung, die durch Helmert (1876) und Pearson (1900) als Prüfverteilung eingeführt wurde. Sind n ⇡ Zufallsvariablen Xi (i = 1, ..., n) stochastisch unabhängig und jeweils standardnormalverteilt (⇡… … Lexikon der Economics
Chi Square — Chi Quadrat (χ2) ist eine Testgröße, mittels der ein Signifikanztest (auch: statistischer Test), der Chi Quadrat Test, durchgeführt wird. Der Chi Quadrat Test basiert auf dem Vergleich zwischen erwarteten und beobachteten Werten zweier Merkmale… … Deutsch Wikipedia

Academic dictionaries and encyclopedias

Chi-Quadrat-Test

Inhaltsverzeichnis

Verteilungstest

Vorgehensweise

Besonderheiten

Schätzung von Verteilungsparametern

Mindestgröße der erwarteten Häufigkeiten

Beispiel zu Anpassungstest

Ergänzung

Unabhängigkeitstest

Vorgehensweise

Besonderheiten

Beispiel zum Unabhängigkeitstest

Homogenitätstest

Vorgehensweise

Anwendungsbedingungen

Vergleich zu Unabhängigkeits- und Anpassungstest

Vierfeldertest

Vorgehensweise

Teststatistik

Testentscheidung

Beispiele und Anwendungen

Beispiel 1

Beispiel 2

Tabelle der Quantile der Chi-Quadrat-Verteilung

Siehe auch

Weblinks

Einzelnachweise

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Chi-Quadrat-Test

Inhaltsverzeichnis

Verteilungstest

Vorgehensweise

Besonderheiten

Schätzung von Verteilungsparametern

Mindestgröße der erwarteten Häufigkeiten

Beispiel zu Anpassungstest

Ergänzung

Unabhängigkeitstest

Vorgehensweise

Besonderheiten

Beispiel zum Unabhängigkeitstest

Homogenitätstest

Vorgehensweise

Anwendungsbedingungen

Vergleich zu Unabhängigkeits- und Anpassungstest

Vierfeldertest

Vorgehensweise

Teststatistik

Testentscheidung

Beispiele und Anwendungen

Beispiel 1

Beispiel 2

Tabelle der Quantile der Chi-Quadrat-Verteilung

Siehe auch

Weblinks

Einzelnachweise

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link