Unkorreliertheit

Unkorreliertheit

Die Kovarianz ist in der Statistik eine (nichtstandardisierte) Maßzahl für den Zusammenhang zweier statistischer Merkmale (im Folgenden X und Y).

  • Die Kovarianz ist positiv, wenn X und Y tendenziell einen gleichsinnigen linearen Zusammenhang besitzen, d. h. hohe Werte von X gehen mit hohen Werten von Y einher und niedrige mit niedrigen.
  • Die Kovarianz ist hingegen negativ, wenn X und Y einen gegensinnigen linearen Zusammenhang aufweisen, d. h. hohe Werte der einen Zufallsvariablen gehen mit niedrigen Werten der anderen Zufallsvariablen einher.
  • Ist das Ergebnis 0, so besteht kein Zusammenhang oder ein nicht linearer Zusammenhang z. B. eine U-förmige Beziehung zwischen den beiden Variablen X und Y.

Die Kovarianz gibt zwar die Richtung einer Beziehung zwischen zwei Variablen an, über die Stärke des Zusammenhangs wird aber keine Aussage getroffen. Dies liegt an der Abhängigkeit des Ergebnisses von den Maßeinheiten der beteiligten Variablen X und Y. Ist z. B. die Kovarianz zweier Variablen mit der Maßeinheit "Meter" 5,2 so ist die Kovarianz der gleichen Werte in der Maßeinheit "Zentimeter" 520. Die Kovarianz ist deshalb in ihrer "Rohform" als Maßzahl für den stochastischen Zusammenhang nur wenig anschaulich und auch schwer vergleichbar.

Um einen Zusammenhang vergleichbar zu machen, muss die Kovarianz normiert werden. Man erhält dann den Korrelationskoeffizienten, dessen Maßzahl sich im Intervall von -1 bis +1 bewegt ( +1: perfekter linearer Zusammenhang, 0: gar kein linearer Zusammenhang, -1: perfekter gegensätzlicher linearer Zusammenhang).

Inhaltsverzeichnis

Definition

Sind X und Y zwei Zufallsvariablen, die quadratisch integrierbar sind, d. h. die Erwartungswerte \operatorname{E}(X^2) und \operatorname E(Y^2) existieren, dann heißt

\operatorname{Cov}(X, Y) := \operatorname E\bigl((X - \operatorname E(X))(Y - \operatorname E(Y))\bigr)

die Kovarianz von X und Y.

Eigenschaften

Beziehung zur Varianz

Die Kovarianz ist eine Verallgemeinerung der Varianz, denn es gilt

\operatorname{Var}(X)=\operatorname{Cov}(X,X).

Weiterhin gilt

\operatorname{Var}(X+Y)=\operatorname{Cov}(X+Y,X+Y) = \operatorname{Var}(X) + \operatorname{Var}(Y) + 2 \operatorname{Cov}(X,Y)
\operatorname{Var}(X-Y)=\operatorname{Cov}(X-Y,X-Y) = \operatorname{Var}(X) + \operatorname{Var}(Y) - 2 \operatorname{Cov}(X,Y)

Beziehung zum Korrelationskoeffizienten

Wird die Kovarianz auf das Produkt der Standardabweichungen von X und Y bezogen (also standardisiert), so spricht man vom Korrelationskoeffizienten

\operatorname{Kor}(X,Y) := \varrho(X,Y) := \frac{\operatorname{Cov}(X,Y)}{\sqrt{\operatorname{Var}(X)} \cdot \sqrt{\operatorname{Var}(Y)}}= \frac{\operatorname{E}\left[(X-\operatorname{E}(X))(Y-\operatorname{E}(Y))\right]}{\sqrt{\operatorname{Var}(X)} \cdot \sqrt{\operatorname{Var}(Y)}}.

Verschiebungssatz

Der Verschiebungssatz von Steiner liefert eine alternative Darstellung der Kovarianz

\operatorname{Cov}(X, Y) = \operatorname{E}(X\cdot Y) - \operatorname{E}(X)\operatorname{E}(Y).

Symmetrie und Linearität

Die Kovarianz ist eine symmetrische Bilinearform auf dem Vektorraum der quadratisch integrierbaren Zufallsvariablen, d. h. es gilt:

\begin{align}
\operatorname{Cov}(X, Y) &= \operatorname{Cov}(Y,X)\\
\operatorname{Cov}(aX,Y) &= a\operatorname{Cov}(X,Y)\\
\operatorname{Cov}(X+Y,Z)&= \operatorname{Cov}(X,Z)+\operatorname{Cov}(Y,Z)
\end{align}

Wegen der Symmetrie ist die Kovarianz auch im zweiten Argument linear.

Lineare Transformation

Ist c eine konstante Zufallsvariable, dann ist \operatorname{Cov}(X,c)=0. Als Folgerung erhält man die lineare Transformation:

\operatorname{Cov}(aX+b,\; cY+d) = a\, c \,\operatorname{Cov}(X, Y)

Diese Eigenschaft bedeutet, dass die Kovarianz vom Maßstab der Zufallsvariablen abhängt. So erhält man beispielsweise die zehnfache Kovarianz, wenn man anstatt X die Zufallsvariable 10X betrachtet. Da diese Eigenschaft die absoluten Werte der Kovarianz schwer interpretierbar macht, betrachtet man häufig stattdessen den maßstabsunabhängigen Korrelationskoeffizienten.

Unkorreliertheit

Falls \operatorname{Cov}(X, Y) = 0, so heißen die Zufallsvariablen X und Y unkorreliert.

Wenn die Zufallsvariablen X_1, \dots, X_n paarweise unkorreliert sind (d. h. \operatorname{Cov}(X_i,X_j)=0 für i\neq j), dann gilt für die Varianz der Summe der Zufallsvariablen

\operatorname{Var}\left(\sum_{i=1}^nX_i\right)=\sum_{i=1}^n\operatorname{Var}(X_i).

Unkorreliertheit bedeutet nicht zwingend, dass die Zufallsvariablen stochastisch unabhängig sind, denn es können nichtlineare Abhängigkeitsstrukturen vorliegen, die die Kovarianz nicht erfassen kann. Dagegen gilt für zwei stochastisch unabhängige Zufallsvariablen X \, und Y \, immer \operatorname{Cov}(X,Y) = 0 \,.

Kovarianzschätzung für zwei Merkmale einer Stichprobe

Es werden für zwei Zufallsvariablen X und Y in einer Stichprobe je n Werte xi und yi (i = 1, \dots , n) erhoben. Man schätzt die Kovarianz der Zufallsvariablen erwartungstreu mit der (korrigierten) Stichproben-Kovarianz

\operatorname{Cov}_{xy} = \frac{1}{n-1}\sum_{i=1}^n{(x_i-\bar{x}) (y_i-\bar{y})},

(mit den Mittelwerten \bar{x} = \frac{1}{n} \sum_{i=1}^n{x_i} und \bar{y} entsprechend.)

Auch hier gilt analog zu oben der Verschiebungssatz

\operatorname{Cov}_{xy} = \frac{1}{n-1} \left( \sum_{i=1}^n {(x_i y_i) - n\bar{x}\bar{y}} \right).

Der Verschiebungssatz wird vor allem angewendet, wenn die Kovarianz von Hand ermittelt wird. Wird die Stichproben-Kovarianz numerisch berechnet, sollte der Verschiebungssatz nicht gebraucht werden, weil das Multiplizieren der Datenwerte x_i \, y_i zu Rundungsfehlern führen kann. Dagegen sind die zentrierten Datenwerte x_i-\bar{x} und y_i-\bar{y} betragsmäßig deutlich kleiner.

Die restlichen Eigenschaften ergeben sich ebenfalls analog zu oben. Es existieren entsprechende Schätzer für die Kovarianzmatrix.

Siehe auch


Wikimedia Foundation.

Игры ⚽ Нужна курсовая?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Unkorreliertheit — Begriff der ⇡ Korrelationsanalyse. U. zweier Variablen liegt vor, wenn ihre ⇡ Kovarianz und damit ihr (Maß )⇡ Korrelationskoeffizient Null ist. U. kann auch anhand des Spearman Pearsonschen Rangkorrelationskoeffizienten festgelegt werden …   Lexikon der Economics

  • Kovarianz (Stochastik) — Die Kovarianz ist in der Statistik eine nichtstandardisierte Maßzahl für den (linearen) Zusammenhang zweier Zufallsvariablen mit gemeinsamer Verteilung. Ist die Kovarianz eine positive Zahl, dann gehen kleine Werte der einen Variable überwiegend… …   Deutsch Wikipedia

  • Autocorrelation function — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Autokorrelationsfunktion — Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen. Dabei werden Artikel gelöscht, die nicht… …   Deutsch Wikipedia

  • Faktoranalyse — Die Faktorenanalyse, häufig auch Faktoranalyse, ist ein Verfahren der multivariaten Statistik. Es dient dazu, aus empirischen Beobachtungen verschiedener manifester Variablen (Observablen) auf zugrunde liegende latente Variable („Faktoren“) zu… …   Deutsch Wikipedia

  • Faktorenanalyse — Die Faktorenanalyse, häufig auch Faktoranalyse, ist ein Verfahren der multivariaten Statistik. Es dient dazu, aus empirischen Beobachtungen vieler verschiedener manifester Variablen (Observablen, Items) auf wenige zugrunde liegende latente… …   Deutsch Wikipedia

  • Geschichte der Stochastik — Roulettespieler, um 1800. Das Glücksspiel war eine der frühesten Triebfedern der Wahrscheinlichkeitsrechnung …   Deutsch Wikipedia

  • Geschichte der Wahrscheinlichkeitsrechnung — Roulettespieler, um 1800. Das Glücksspiel war eine der frühesten Triebfedern der Wahrscheinlichkeitsrechnung …   Deutsch Wikipedia

  • Geschichte der Wahrscheinlichkeitstheorie — Roulettespieler, um 1800. Das Glücksspiel war eine der frühesten Triebfedern der Wahrscheinlichkeitsrechnung …   Deutsch Wikipedia

  • Hauptfaktorenanalyse — Die Faktorenanalyse, häufig auch Faktoranalyse, ist ein Verfahren der multivariaten Statistik. Es dient dazu, aus empirischen Beobachtungen verschiedener manifester Variablen (Observablen) auf zugrunde liegende latente Variable („Faktoren“) zu… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”