Covarianță și corelarea
Cât de des ați auzit declarațiile, care prevede că un fenomen este corelat cu celelalte?
„Creștere ridicată este corelată cu o bună educație și fericire, experți înființat Gallup serviciu sociologic.“
„Prețul petrolului este corelat cu rata de schimb.“
„Durerea din mușchii după exercitarea nu este corelată cu hipertrofia fibrelor musculare.“
Unul devine impresia că termenul „corelare“ a fost utilizat pe scară largă nu numai în știință, ci și în viața de zi cu zi. Corelația reflectă gradul de relație liniară între două aleatoare. De exemplu, atunci când prețurile petrolului începe să scadă, rata de schimb dolar față de rubla începe să crească.
Din toate cele de mai sus se poate concluziona că, în descrierea variabilelor aleatoare bidimensionale nu este suficient de astfel de caracteristici bine cunoscute, ca așteptare, varianța, abaterea standard. Deci, este adesea folosit pentru a descrie ei sunt două caracteristici foarte importante: covarianță și corelarea.
Covarianță $ CoV \ stânga (X, \ Y \ dreapta) $ variabile aleatoare $ X $ si $ Y $ este o așteptare matematică a produsului de variabile aleatoare $ XM \ stânga (X \ dreapta) $ și $ YM \ left (Y \ dreapta) $ , adică:
Este convenabil să se calculeze covarianța variabilelor aleatoare X $ si $ Y $ prin următoarea formulă:
care poate fi obținut din prima formulă, folosind proprietățile așteptărilor. Lista proprietățile de bază ale covarianță.
1. Covarianță variabilă aleatoare cu ea însăși este dispersia sa.
2. Covarianță este simetrică.
$$ cov \ stânga (X, \ Y \ dreapta) = cov \ stânga (Y \ X \ dreapta). $$
3. În cazul în care variabilele aleatoare X $ $ $ Y $ și independent, atunci:
4. Un factor constant poate fi luat ca un semn de covarianță.
$$ cov \ stânga (cX, \ Y \ dreapta) = cov \ stânga (X, \ cY \ dreapta) = c \ cdot cov \ stânga (X, \ Y \ dreapta). $$
5. Covarianță nu se schimba în cazul în care una dintre variabilele aleatoare (sau două imediat) se adaugă o cantitate constantă:
$$ cov \ stânga (X + c, \ Y \ dreapta) = cov \ stânga (X, \ Y + c \ dreapta) = cov \ stânga (X + x, \ Y + c \ dreapta) = cov \ stânga ( X, \ Y \ dreapta). $$
6. $ cov \ left (aX + b, \ cY + d \ dreapta) = ac \ cdot cov \ stânga (X, \ Y \ dreapta) $.
9. Variația sumei (diferență) de variabile aleatoare este egală cu suma varianțelor lor, plus (minus) de două ori covarianța acestor variabile aleatoare:
$$ D \ stânga (X \ pm Y \ dreapta) = D \ stânga (X \ dreapta) + D \ stânga (Y \ dreapta) \ pm 2cov \ stânga (X, \ Y \ dreapta). $$
Exemplul 1. Dana tabel de corespondență vector aleator $ \ stânga (X, \ Y \ dreapta) $. Se calculează covarianța $ cov \ stânga (X, \ Y \ dreapta) $.
$ \ Începe
\ hline
X \ backslash Y - -6 - 0 - 3 \\
\ hline
-2-0.1 - 0 - 0.2 \\
\ hline
0 - 0,05 - P_ - 0 \\
\ hline
1 - 0 - 0.2-0.05 \\
\ hline
7-0.1 - 0 - 0,1 până \\
\ hline
\ End $
Evenimente $ \ stânga (X = x_i, \ Y = y_j \ dreapta) formează $ un grup complet de evenimente, astfel încât suma tuturor probabilităților $ P_ $, specificate în tabel trebuie să fie egală cu 1. Apoi $ 0,1 până + 0 + 0,2 + 0,05 + P_ + 0 + 0 + 0,2 + 0,05 + 0,1 + 0,1 + 0 = 1 $, deci $ P_ = 0,2 $.
$ \ Începe
\ hline
X \ backslash Y - -6 - 0 - 3 \\
\ hline
-2-0.1 - 0 - 0.2 \\
\ hline
0-0.05 - 0.2-0 \\
\ hline
1 - 0 - 0.2-0.05 \\
\ hline
7-0.1 - 0 - 0,1 până \\
\ hline
\ End $
Folosind formula $ P_ = \ sum _p_ $, găsiți numărul de distribuție a variabilei aleatoare X $ $.
$ \ Începe
\ hline
X - -2-0 - 1 - 7 \\
\ hline
p_i - 0.3-0.25 - 0.25-0.2 \\
\ hline
\ End $
$$ M \ stânga (X \ dreapta) = \ sum ^ n _ = - 2 \ cdot 0,3 + 0 \ cdot 0,25 + 1 \ cdot 0,25 + 7 \ cdot 0,2 = 1,05 $. $
Folosind formula $ qjndex = \ sum _p_ $, vom găsi numărul de distribuție a variabilei aleatoare $ Y $.
$$ M \ stânga (Y \ dreapta) = \ sum ^ n _ = - 6 \ cdot 0,25 + 0 \ cdot 0,4 + 3 \ cdot = -0,45 0,35 $$.
Deoarece $ P \ stânga (X = -2, \ Y = -6 \ dreapta) = 0,1 \ ne 0,3 \ cdot 0,25 $, atunci variabilele aleatoare X $, \ Y $ sunt dependente.
Definim covarianța $ CoV \ \ din stânga (X, \ Y \ dreapta) $ variabile aleatoare X $, \ Y $ formula $ cov \ stânga (X, \ Y \ dreapta) = M \ stânga (XY \ dreapta) -M \ stânga (X \ dreapta) M \ stânga (Y \ dreapta) $. Așteptarea matematică a produsului de variabile aleatoare X $, \ Y $ este:
$$ M \ stânga (XY \ dreapta) = \ sum_x_iy_j> = 0,1 \ cdot \ stânga (-2 \ dreapta) \ cdot \ left (-6 \ dreapta) +0,2 \ cdot \ stânga (-2 \ dreapta) \ cdot 3 + 0,05 \ cdot 1 \ cdot 3 + 0,1 \ cdot 7 \ cdot \ stânga (-6 \ dreapta) +0,1 \ cdot 7 \ cdot 3 = -1.95. $$Apoi $ cov \ stânga (X, \ Y \ dreapta) = M \ stânga (XY \ dreapta) -M \ stânga (X \ dreapta) M \ left (Y \ dreapta) = - 1,95-1,05 \ cdot \ stânga (-0,45 \ dreapta) = -. 1,4775 $ în cazul în care variabilele aleatoare sunt independente, atunci covarianță lor este zero. În cazul nostru, $ acope (X, Y) \ ne 0 $.
Coeficientul de corelație a variabilelor aleatoare X $ $ si $ Y $ este numărul:
Enumerăm proprietățile de bază ale coeficientului de corelație.
3. $ \ rho \ stânga (X, \ Y \ dreapta) = 0 $ pentru variabile independente aleatoare $ X $ si $ Y $.
6. $ \ left | \ rho \ stânga (X, \ Y \ dreapta) \ dreapta | = 1 \ Leftrightarrow Y = aX + b $.
A fost anterior a spus că coeficientul de corelație $ \ rho \ stânga (X, \ Y \ dreapta) $ reflectă gradul de relație liniară între două variabile aleatoare $ X $ si $ Y $.
Când $ \ rho \ stânga (X, \ Y \ dreapta)> 0 $ se poate concluziona că, odată cu o creștere a variabilei aleatoare $ X $ variabila aleatoare $ Y $ tinde să crească. Aceasta se numește o corelație pozitivă. De exemplu, înălțimea și greutatea persoanei asociate corelație pozitivă.
Când $ \ rho \ stânga (X, \ Y \ dreapta)<0$ можно сделать вывод о том, что с ростом случайной величины $X$ случайная величина $Y$ имеет тенденцию к уменьшению. Это называется отрицательной корреляционной зависимостью. Например, температура и время сохранности продуктов питания связаны между собой отрицательной корреляционной зависимостью.
Când $ \ rho \ stânga (X, \ Y \ dreapta) = 0 $ variabile aleatoare $ X $ si $ Y $ numit necorelate. Este demn de remarcat faptul că necorelate variabile aleatoare $ X $ si $ Y $ nu înseamnă independența statistică a acestora, se spune doar că există o relație liniară între ele.
Exemplul 2. Definiți coeficientul de corelație $ \ rho \ stânga (X, \ Y \ dreapta) $ pentru bidimensional variabilă aleatoare $ \ left (X, \ Y \ dreapta) $ din exemplul 1.
Coeficientul de corelație a variabilelor aleatoare X $, \ Y $ este egal cu $ R_ = = = -0134. $ Deoarece $ R_<0$, то с ростом $X$ случайная величина $Y$ имеет тенденцию к уменьшению (отрицательная корреляционная зависимость).