Covarianță și corelarea - studopediya

Covarianță exprimă gradul de dependențe statistice între cele două seturi de date și se determină din următoarea ecuație (3.1):

în care X. Y - o multitudine de variabile aleatoare de dimensiune m; M (X) - speranța matematică a unei variabile aleatoare X; M (Y) - speranța matematică a unei variabile aleatoare Y.







Astfel cum rezultă din formulă, covariation pozitivă observată în cazul în care valorile mai mari ale variabilei x aleatoare corespund valorilor mari ale variabilei aleatoare Y. adică între ele există o corelație directă puternică. Prin urmare covariance negativ se va produce la valori scăzute în funcție de variabila aleatoare X este valori mai mari ale variabilei Y. aleatoare În funcție ușoară valoarea indicelui covarianței este aproape de 0 ° C.

Covarianță unităților de măsură depinde de variabilele studiate, care limitează aplicarea sa în practică. Un mod mai convenabil pentru a fi utilizat în test este derivat din indexul său - R. coeficientul de corelație calculat prin formula (3-2):

Coeficientul de corelație are aceleași proprietăți ca și covarianță, dar este adimensional și are o valoare de -1 (indică o relație inversă liniară) la una (relație directă caracteristică liniară). Pentru variabilele aleatoare de corelație valoare independentă coeficient apropiat de 0.

Determinarea caracteristicilor cantitative pentru evaluarea apropierii relației dintre valorile aleatoare din SPT EXCEL se poate face în două moduri:

- cu instrumente speciale de analiză statistică.

În cazul în care numărul de variabile studiate mai mult de 2, este mai convenabil de a utiliza instrumentele de analiză.

instrument de analiză a datelor „Corelare“

Definim gradul de etanșeitate interdependențele între variabilele V, Q, P, NCF și NPV. În același timp, ca măsură vom folosi indicele de corelare R.

1. Selectați „Analiza datelor“. Selectați din lista de butonul „Instrumente de analiză“, selectați „Corelare“ și faceți clic pe „OK“ (Figura 3.1). Rezultatul va fi apariția unui instrument de dialog caseta „corespondență“.

2. Completați caseta de dialog, așa cum se arată în figura 3.2.

Tipul obținute după EBS efectuarea operațiilor elementare de formatare este prezentată în figura 3.3.

Figura 3.1. Listă de instrumente de analiză (selectând „corelare“)

Figura 3.2. Umplere instrument de dialog „Corelare“

Fig. 3.3. Rezultatele analizei de corelație

Rezultatele analizei de corelare sunt prezentate sub forma într-o matrice EBS pătrat, doar jumătate umplut, deoarece coeficientul de corelație dintre cele două variabile aleatoare nu sunt independente de ordinea de prelucrare. Este ușor de observat că această matrice este simetrică față de elementele principale diagonale sunt egale cu 1, deoarece fiecare variabilă corelată cu ea însăși.

După cum rezultă din rezultatele analizei de corelație, prezentată în procesul de soluționare exemplului anterior ipoteza independenței distribuțiile variabilelor cheie V, Q, P a confirmat în general. Valorile coeficienților de corelație între costurile variabile V, valoarea prețului P și Q (celulele B3: B4, C4) este suficient de aproape de 0 ° C.

La rândul său, valoarea indicatorului NPV depinde de valoarea debitului de plăți (R = 1). Mai mult decât atât, există un grad mediu de corelație între Q și NPV (R = 0,548), P și NPV (R = 0,67). Așa cum era de așteptat, între valorile V și există un NPV moderat inversă corelație (R = -0,39).

Utilitatea analizei statistice ulterioare a rezultatelor experimentului de simulare este, de asemenea, în faptul că, în multe cazuri, acesta dezvăluie incorectitudinea în datele originale, sau chiar erori în formularea problemei. În special, în acest exemplu, lipsa de corelare între costurile variabile și volumul V Produs: Q necesită o explicație suplimentară, deoarece o creștere a acestuia din urmă, magnitudinea V ar trebui, de asemenea, crește. Astfel, intervalul așteptat de cheltuieli variabile V modificări trebuie să fie testate și, eventual, ajustate.

Trebuie remarcat faptul că aproape de valoarea zero a coeficientului de corelație R indică o relație liniară între variabilele studiate, dar nu exclud posibilitatea de dependență non-liniară. În plus, o corelație ridicată nu neapărat înseamnă întotdeauna o relație cauzală, deoarece cele două variabile studiate pot depinde de a treia valoare.

La efectuarea experimentului de simulare și analiză probabilistă ulterioară a rezultatelor obținute, am pornit de la ipoteza distribuției normale a indicatorilor de sursă și de ieșire. Cu toate acestea, validitatea ipotezelor făcute, cel puțin pentru parametrul NPV de ieșire, trebuie să fie verificate.

Pentru a testa ipoteza testelor distribuite în mod normal, variabile aleatoare specifice statistice utilizate: Kolmogorov-Smirnov, c 2. În general, RFP EXCEL vă permite să efectueze rapid și eficient calculul criteriilor necesare și să efectueze o evaluare statistică a ipotezelor.







instrument de analiză a datelor „Statisticile descriptive“

Cele mai aleatoare caracteristici variabile așa cum știm, cu atât mai bine putem judeca la descris procese. Instrumentul „Statisticile descriptive“ calculează automat cele mai utilizate pe scară largă în analiza practică a caracteristicilor distribuții. Valorile pot fi determinate pentru mai multe variabile studiate.

Definirea parametrilor statistici descriptive pentru variabilele V, Q, P, NCF, NPV. Pentru a face acest lucru, urmați acești pași.

1. „Analiza datelor“. Selectați din lista de „instrumente de analiză“ selectați „statistici descriptive“.

2. Completați caseta de dialog, așa cum se arată în Figura 3.4, apoi faceți clic pe butonul „OK“.

Rezultatul acestor acțiuni va fi formarea unei foi separate, care conține caracteristicile calculate statistici descriptive pentru variabilele studiate. Efectuarea operație de formatare, este posibil să se determine ET forma mai intuitiv rezultat (Figura 3.5).

Multe dintre caracteristicile enumerate în ET sunteți deja familiarizați cu, și valorile lor au fost deja definite folosind funcțiile corespunzătoare de pe foaia „Rezultatele analizei.“ Prin urmare, considerăm că numai cei care nu au fost menționate anterior.

A doua linie conține valorile ET eroare standard e pentru valorile medii ale distribuțiilor. Cu alte cuvinte, media sau valoarea așteptată a variabilei aleatoare M (E) este determinată cu o precizie de ± e.

Fig. 3.4. „Statisticile descriptive“ Completarea câmpurilor de dialog

Figura 3.5. Statisticile descriptive pentru variabilele de studiu

Median - valoarea variabilei aleatoare care împarte zona delimitată de jumătatea curbei de distribuție (adică, rândul din mijloc sau interval numeric). Pe măsură ce așteptările, mediana este una dintre caracteristicile aleatoare centrul de distribuție variabilă. În distribuții simetrice ale valorii medii să fie egală sau suficient de aproape de așteptări.

După cum rezultă din rezultatele, această condiție este valabilă pentru variabilele originale V, Q, P (valori mediane se află în intervalul de M (E) ± e adică -. Aproximând media). Cu toate acestea variabile Scoring NCF, valorile NPV sunt mai mici decât media medianelor care sugerează asimetria unilaterală a distribuțiilor lor.

Moda - valoarea cea mai probabilă a variabilei aleatoare (valoarea cea mai comună în intervalul de date). Pentru distribuții simetrice de moda este speranța. Uneori, moda poate fi absent. În acest caz, RFP EXCEL returnat un mesaj de eroare. Astfel, modul de calcul nu este posibilă.

Kurtosis caracterizează acuitate (valoare pozitivă) sau planitate (valoare negativă) a distribuției în comparație cu curba normală. Teoretic, coeficientul de boltire distribuției normale trebuie să fie egală cu 0. Cu toate acestea, în practică, pentru populația generală de volume mari de valori scăzute poate fi neglijată.

În acest exemplu, aproximativ aceeași pozitive observate în coeficientul de boltire distribuțiile variabilelor Q, NCF, NPV. Astfel, graficele acestor distribuții vor fi aproape subliniat, în comparație cu curba normală. În consecință distribuții grafice pentru variabilele V și P sunt relativ ușor flata la normal.

Asimetria (coeficient de asimetrie sau teșitură - s) caracterizează deplasarea distribuției de medie. Dacă o valoare pozitivă a distribuției coeficientului de înclinat spre dreapta, adică, partea sa se mai află la dreapta față de centru (așteptare), și vice-versa. Pentru un coeficient de asimetrie de distribuție normală este 0. În practică, aceasta poate fi neglijată valori mici.

În special distribuții asimetrice ale variabilelor V, Q, P, în acest caz, poate fi considerată neglijabilă, cu toate acestea, este imposibil de spus despre distribuția valorilor NPV.

Facem o evaluare a semnificației coeficientului de asimetrie pentru distribuirea NPV. Cel mai simplu mod de a obține o astfel de evaluare este de a determina standard (medie pătrată) eroarea de asimetrie, care se calculează cu formula (3-3):

unde n - numărul de valori ale variabilei aleatoare (în acest caz, 500).

Dacă raportul dintre coeficientul de asimetrie s la valoarea erorii s ca cel puțin trei (adică s / s ca <3), то асимметрия считается несущественной, а ее наличие объясняется воздействием случайных факторов. В противном случае асимметрия статистически значима и факт ее наличия требует дополнительной интерпретации. Осуществим оценку значимости коэффициента асимметрии для рассматриваемого примера.

Intră în orice celulă ET formula:

= 0,763 / SQRT (6 * 499/501 * 503) (rezultat: 7,06).

Deoarece raportul s / s ca> 3, asimetria trebuie considerată semnificativă. Astfel, ipoteza noastră originală a dreapta asimetria a distribuției NPV confirmate.

Pentru acest exemplu, prezența asimetrie drept poate fi considerat un lucru pozitiv, deoarece aceasta înseamnă că o mare parte a distribuției este mai mare decât așteptările, și anume, Valorile mari NPV sunt mai probabile.

Într-un mod similar poate fi realizată prin valoarea de semnificație formula e aplatizării pentru calcularea erorii standard a excesului este de forma (3.4) .:

unde n - numărul de valori ale variabilei aleatoare.

În cazul în care raportul e / s ex <3, эксцесс считается незначительным и его величиной можно пренебречь.

„Intervalul“ valoare este definită ca diferența dintre valoarea maximă și valoarea minimă a variabilei aleatoare (seria numerică). „Cont“ și parametrii „Suma“ sunt un număr de valori într-un anumit interval și suma, respectiv.

Această din urmă caracteristică „nivelul de fiabilitate“, arată amploarea a intervalului de încredere pentru valoarea medie în funcție de un nivel predeterminat de nivel implicit fiabilitate doveriya.Po presupusă a fi de 95% fiabilitatea sau.

Pentru acest exemplu, acest lucru înseamnă că, cu o probabilitate de 0,95 (95%), valoarea NPV așteptare se încadrează în intervalul de ± 3412.14 224.88.

Puteți specifica un alt nivel de securitate, de exemplu, - 98%, introducând valorile corespunzătoare în caseta de dialog „nivel de fiabilitate“ „statistici descriptive“. Trebuie remarcat faptul că nivelul receptionata mai ridicat de fiabilitate, cu atât mai mare va fi valoarea intervalului de încredere pentru media.

În concluzie, observăm că simularea permite luarea în considerare cel mai mare număr posibil de factori de mediu pentru a sprijini managementul de luare a deciziilor și este cel mai puternic instrument pentru analiza riscurilor legate de investiții. Nevoia de utilizarea sa în practică, din cauza piața financiară internă are subiectivitate caracterizată românesc, dependența de factori non-economici și un grad ridicat de incertitudine.

Rezultatele simulării pot fi completate cu analize și management probabilistică și statistice, în general, să furnizeze informațiile cele mai complete cu privire la amploarea impactului factorilor cheie asupra rezultatelor așteptate și posibile scenarii.