Run-Test

Der Run- oder Runs-Test (auch Wald-Wolfowitz-Test, nach Abraham Wald und Jacob Wolfowitz, Iterationstest oder Geary-Test) ist ein nichtparametrischer Test auf Zufälligkeit einer Folge. Ausgegangen wird von einem Urnenmodell mit zwei Sorten Kugeln (dichotomen Grundgesamtheit). Es werden n Kugeln entnommen und es soll die Hypothese geprüft werden, dass die Entnahme zufällig erfolgt ist.

Inhaltsverzeichnis

1 Vorgehensweise
2 Einfaches Beispiel
3 Ergänzungen
4 Anwendungen
- 4.1 Beispiel für ein metrisches Merkmal
5 Literatur
6 Siehe auch
7 Weblinks

Vorgehensweise

Es wurden einer dichotomen Grundgesamtheit n Kugeln entnommen. Die Ergebnisse liegen in ihrer chronologischen Abfolge vor. Es werden nun alle benachbarten Ergebnisse gleicher Ausprägung zu einem Lauf oder Run zusammengefasst. Wenn die Folge tatsächlich zufällig ist, sollten nicht zu wenig Runs vorliegen, aber auch nicht zu viele.

Es wird die Hypothese aufgestellt: Die Entnahme erfolgte zufällig.

Für die Festlegung der Zahl der Runs, bei der die Hypothese abgelehnt wird, wird die Verteilung der Runs benötigt: Es seien n₁ die Zahl der Kugeln erster Sorte und n₂ = n - n₁ der zweiten Sorte; es sei r die Zahl der Runs. Nach dem Symmetrieprinzip ist die Wahrscheinlichkeit für jede beliebige Folge der Kugeln bei zufälliger Entnahme gleich groß. Es gibt insgesamt

$\frac{(n_1 + n_2)!}{n_1!\, n_2!}$

Möglichkeiten der Entnahme.

Bezüglich der Verteilung der Zahl der Runs unterscheidet man die Fälle:

1. Die Zahl der Runs r ist geradzahlig:

Es liegen $q= \tfrac 12 r$ Runs der Kugeln der ersten Sorte und auch $q= \tfrac 12 r$ Runs der Kugeln der zweiten Sorte vor. Die Wahrscheinlichkeit, dass genau

r = 2 q

Runs eingetreten sind, ist dann

$P(R=2q) = \frac { 2 {{n_1-1} \choose {q-1}} {{n_2-1} \choose {q-1}}} {{{n_1+n_2} \choose n_1}}$

2. Die Zahl der Runs r ist ungeradzahlig:

Es liegen $q +1 = \tfrac 12(r+1)$ Runs der Kugeln der ersten Sorte und $q =\tfrac 12(r-1)$ Runs der Kugeln der zweiten Sorte vor oder der umgekehrte Fall. Die Wahrscheinlichkeit, dass genau

r = 2 q + 1

Runs eingetreten sind, berechnet sich dann als Summe aus diesen beiden Möglichkeiten

$P(R=2q+1)= \frac { {n_1-1 \choose q} {n_2-1 \choose q-1 } + {n_1-1 \choose q-1} {n_2-1 \choose q }} {{n_1+n_2 \choose n_1}}$

Ist r zu klein oder zu groß, führt das zur Ablehnung der Nullhypothese. Bei einem Signifikanzniveau von $α$ wird H₀ abgelehnt, wenn für die Prüfgröße r gilt:

$r \le r(\tfrac {\alpha}{2})$ oder $r \ge r(1 - \tfrac {\alpha}{2})$

mit r(p) als Quantil der Verteilung von R an der Stelle p, wobei hier das Prinzip des konservativen Testens angewendet wird. Da die Berechnung der kritischen Werte von r für die Ablehnung der Hypothese umständlich ist, bedient man sich häufig einer Tabelle.

Einfaches Beispiel

Für eine Podiumsdiskussion mit zwei politischen Parteien wurden die Sprecher angeblich zufällig ermittelt. Es wurde ausgelost, dass von der Partei Supi 4 Vertreter und von der Partei Toll 5 Vertreter in der folgenden Reihe sprechen dürfen:

S S  T  S  T T T  S  T

Ein Vertreter von Toll beschwerte sich, dass S bevorzugt würde. Es wurde ein Run-Test vorgenommen:

Es ist n₁ = 4 und n₂ = 5. Man erhielt r = 6 Runs.

Deutlich ist, dass im Falle vieler Runs kein Verdacht besteht auf Bevorzugung einer der Parteien. Die Nullhypothese wird also abgelehnt, wenn es zu wenig Runs gibt. Nach der Tabelle des Run-Testes wird H₀ abgelehnt, wenn r ≤ 2. Also liegt die Prüfgröße r = 6 nicht im Ablehnungsbereich; man kann nach den Kriterien des Run-Testes nicht darauf schließen, dass die Reihenfolge der Sprecher nicht zufällig ist.

Übrigens wird auch im nächsten Fall:

S S S  T  S  T T T T

mit r = 4 Runs, die Nullhypothese nicht abgelehnt, obwohl fast jeder einen Verdacht haben wird, dass Supi vorgezogen wurde. Man kann aber wegen der relativ geringen Anzahl der Beobachtungen nicht ausschließen, dass das Ergebnis auf Zufall beruht.

Ergänzungen

Parameter der Verteilung von R

Der Erwartungswert von R ist

$\operatorname{E}(R) = \frac{2 n_1 n_2}{n} + 1$

und die Varianz

$\operatorname{Var}(R) = \frac{2 n_1 n_2 (2 n_1 n_2 - n)}{n^2(n - 1)}$ .

Grundgesamtheit mit mehr als zwei Ausprägungen des Merkmals

Liegt eine endliche Folge reeller Zahlen $(x i)$ eines metrischen Merkmals vor, wird die Folge dichotomisiert: Man bestimmt zunächst den Median z der Folge. Werte $x i < z$ werden dann als Kugeln der ersten Sorte, Werte $x i > z$ als Kugeln der zweiten Sorte interpretiert. Die entstandene dichotome Folge kann dann wieder auf Zufälligkeit getestet werden (siehe Beispiel unten).

Liegt eine nichtnumerische Symbolsequenz mit mehr als zwei Ausprägungen vor, muss zunächst eine numerische Reihe erzeugt werden, wobei hier das Problem bestehen kann, dass die Symbole nicht geordnet werden können.

Normalapproximation

Für Stichprobenumfänge n₁,n₂ > 20 ist die Zahl der Runs R annähernd normalverteilt mit Erwartungswert und Varianz wie oben. Man erhält die standardisierte Prüfgröße

$z = \frac{r - (\frac{2 n_1 n_2}{n} + 1 )}{\sqrt{\frac{2 n_1 n_2 (2 n_1 n_2 - n)}{n^2(n_1 + n_2 - 1)}}}$

Die Hypothese wird abgelehnt, wenn

$z < -z(1 - \frac {\alpha}{2})$ oder $z > z(1 - \frac {\alpha}{2})$

mit $z(1 - \frac {\alpha}{2})$ als Quantil der Standardnormalverteilung für die Wahrscheinlichkeit $1 - \frac {\alpha}{2}$ .

Anwendungen

Der Runtest kann angewendet werden, um Stationarität bzw. Nicht-Korrelation in einer Zeitreihe oder anderen Sequenz zu überprüfen, vor allem wenn die Verteilung des Merkmals unbekannt ist. Die Nullhypothese ist hier, dass aufeinanderfolgende Werte unkorreliert sind.

Der Run-Test kann mit dem Chi-Quadrat-Test kombiniert werden, da beide Prüfgrößen asymptotisch unabhängig voneinander sind.

Beispiel für ein metrisches Merkmal

Es liegt die Folge

13  3      14      14      1       14      3       8       14      17      9       14      13      2       16      1       3       12      13      14

vor. Sie wird mit dem Median z = 13 dichotomisiert. Für die erste Ausprägung wird + gesetzt, für die zweite Ausprägung -.

0  -10     1       1       -12     1       -10     -5      1       4       -4      1       0       -11     3       -12     -10     -1      0       1

+  -       +       +       -       +       -       -       +       +       -       +       +       -       +       -       -       -       +       +

Man erhält bei n₁ = 11 (+) und n₂ = 9 (-) r = 13 Runs. R ist annähernd normalverteilt mit dem Erwartungswert

$\operatorname{E}(R) = \frac{(2\cdot11\cdot9)}{20} + 1 = 10,9$

und der Varianz

$\operatorname{Var}(R)= \frac{2 \cdot 11 \cdot 9 \cdot (2 \cdot 11 \cdot 9 - 20)}{20^2 \cdot 19}= 4,6$ .

Die Prüfgröße z errechnet sich dann als

$\frac{13 - 10,9}{\sqrt{4,6}}= 1,0$

Bei einem Signifikanzniveau von 0,05 wird H₀ abgelehnt, wenn |z| > 1,96. Dies ist nicht der Fall.

Entscheidung: Die Hypothese wird nicht abgelehnt. Die Elemente der Stichprobe sind vermutlich zufällig entnommen worden.

Literatur

James V. Bradley: Distribution-Free Statistical Tests, 1968, Chapter 12, ISBN 0-13-216259-8
Herbert Büning, Götz Trenkler: Nichtparametrische statistische Methoden, 1999, Kapitel 4.5, ISBN 3-11-016351-9
Wald A., Wolfowitz J.: On a Test Whether Two Samples are from the Same Population, The Annals of Mathematical Statistics, Vol. 11, No. 2 (Jun., 1940), pp. 147-162

Siehe auch

Autokorrelation, Zufallszahlengenerator, Pseudozufallszahlen, Trend, Median, Varianz

Weblinks

Kategorien:

Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

test run — UK US noun [countable] [singular test run plural test runs] a process designed to test whether a machine or system works well Thesaurus: general words for tests and testingsynonym * * … Useful english dictionary
test-run — ˈtest run noun [countable] an occasion when a new machine, piece of equipment, or procedure is tested to find out whether it works correctly: • Fire during a test run seriously damaged an experimental Japanese supertrain … Financial and business terms
Run — A run consists of a series of bid and offer quotes for different securities or maturities. Dealers give to and ask for runs from each other. The New York Times Financial Glossary * * * ▪ I. run run 1 [rʌn] verb ran PASTTENSE [ræn] … Financial and business terms
run — A run consists of a series of bid and offer quotes for different securities or maturities ( maturity). dealers give and ask for runs from each other. Bloomberg Financial Dictionary * * * ▪ I. run run 1 [rʌn] verb ran … Financial and business terms
Test Anything Protocol — The Test Anything Protocol (TAP) is a protocol to allow communication betwen unit tests and a test harness. It allows individual tests (TAP producers) to communicate test results to the testing harness in a language agnostic way. Originally… … Wikipedia
Run-length-kodierung — Die Lauflängenkodierung (engl. Run length encoding, kurz RLE) ist ein sehr einfacher verlustfreier Kompressionsalgorithmus für digitale Daten. Sie ist besonders gut geeignet, Wiederholungen oder Sequenzen von gleichen Werten verkürzt darzustellen … Deutsch Wikipedia
Run-length encoding — Die Lauflängenkodierung (engl. Run length encoding, kurz RLE) ist ein sehr einfacher verlustfreier Kompressionsalgorithmus für digitale Daten. Sie ist besonders gut geeignet, Wiederholungen oder Sequenzen von gleichen Werten verkürzt darzustellen … Deutsch Wikipedia
Run Length Encoded — Die Lauflängenkodierung (engl. Run length encoding, kurz RLE) ist ein sehr einfacher verlustfreier Kompressionsalgorithmus für digitale Daten. Sie ist besonders gut geeignet, Wiederholungen oder Sequenzen von gleichen Werten verkürzt darzustellen … Deutsch Wikipedia
Test-driven development — (TDD ) is a software development technique consisting of short iterations where new test cases covering the desired improvement or new functionality are written first, then the production code necessary to pass the tests is implemented, and… … Wikipedia
Run (cricket) — Le run, ou la course, est l unité de base d un score individuel ou collectif au cricket. Le total des runs marqués par les batteurs d une équipe, ainsi que d éventuels « extras » constitue le score de celle ci au cours d une manche.… … Wikipédia en Français

Academic dictionaries and encyclopedias

Run-Test

Inhaltsverzeichnis

Vorgehensweise

Einfaches Beispiel

Ergänzungen

Parameter der Verteilung von R

Grundgesamtheit mit mehr als zwei Ausprägungen des Merkmals

Normalapproximation

Anwendungen

Beispiel für ein metrisches Merkmal

Literatur

Siehe auch

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

Run-Test

Inhaltsverzeichnis

Vorgehensweise

Einfaches Beispiel

Ergänzungen

Parameter der Verteilung von R

Grundgesamtheit mit mehr als zwei Ausprägungen des Merkmals

Normalapproximation

Anwendungen

Beispiel für ein metrisches Merkmal

Literatur

Siehe auch

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link