Tabelul de distribuție normală, explicat

Analiza statistica - Distributia frecventelor cu Excel 2007 (Decembrie 2024)

Analiza statistica - Distributia frecventelor cu Excel 2007 (Decembrie 2024)
Tabelul de distribuție normală, explicat
Anonim

Formula de distribuție normală se bazează pe doi parametri simpli - deviația medie și standard - caracteristicile unui anumit set de date. În timp ce media indică valoarea "centrală" sau medie a întregului set de date, abaterea standard indică "răspândirea" sau variația punctelor de date în jurul valorii medii.

Luați în considerare următoarele două seturi de date:

Setul de date 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10}

- setul de date 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Pentru setul de date1, media = 10 și abaterea standard (stddev)

Pentru Dataset2, mean = 10 și deviația standard (stddev) = 2. 83

Să comparăm aceste valori pentru DataSet1:

Similar pentru DataSet2:

Linia orizontală roșie din ambele grafice de mai sus indică valoarea "medie" sau medie a fiecărui set de date (10 în ambele cazuri). Săgețile roz în al doilea grafic indică răspândirea sau variația valorilor datelor de la valoarea medie. Aceasta este reprezentată de o deviație standard de 2.83 în cazul DataSet2. Din moment ce DataSet1 are toate valorile aceleași (ca 10 fiecare) și nici o variație, valoarea stddev este zero și deci nu sunt aplicabile săgeți roz.

Valoarea stddev are câteva caracteristici semnificative și utile, care sunt extrem de utile în analiza datelor. Pentru o distribuție normală, valorile datelor sunt distribuite simetric pe ambele părți ale mediei. Pentru orice set de date distribuite în mod normal, graficul grafic cu stddev pe axa orizontală și nr. din valorile date pe axa verticală, se obține graficul următor.

Proprietățile unei distribuiri normale

Curba normală este simetrică față de media;

  1. Media este la mijloc și împarte zona în două jumătăți;
  2. Suprafața totală sub curbă este egală cu 1 pentru media = 0 și stdev = 1;
  3. Distribuția este complet descrisă prin media și stddev
  4. După cum se poate vedea din graficul de mai sus, stddev reprezintă următoarea:

68. 3%

  • din valorile datelor sunt 1 deviație standard din media (-1 la +1) 95. 4%
  • valorilor datelor sunt 2 deviații standard ale mediei (-2 până la +2) 99. 7%
  • din valorile datelor se situează în 3 deviații standard ale mediei (-3 la +3) Aria sub curba în formă de clopot, măsurată, indică probabilitatea dorită interval:

mai mic decât X: -

  • e. g. probabilitatea ca valorile datelor să fie mai mici de 70 mai mari decât X -
  • e. g. probabilitatea ca valorile datelor să fie mai mari de 95 între X
  • 1 și X 2 - e. g. probabilitatea valorilor datelor între 65 și 85 unde X este o valoare de interes (exemplele de mai jos).

Plotarea și calcularea zonei nu este întotdeauna convenabilă, dat fiind că diferite seturi de date vor avea valori medii și stddev diferite.Pentru a facilita o metodă standard uniformă pentru calcule ușoare și aplicabilitate la problemele din lumea reală, a fost introdusă conversia standard la valorile Z, care formează partea din

Tabelul de distribuție normală . Z = (X - medie) / stddev, unde X este variabila aleatoare.

În mod esențial, această conversie forțează standardul 0 și respectiv 1 la standard și stddev, ceea ce permite ca un set standard de valori Z (de la

Table de distribuție normală ) să fie utilizat pentru calcule ușoare . Un tablou standard al tabelului standard de valori z conține valorile de probabilitate după cum urmează: z

0. 00

0. 01

0. 02

0. 03

0. 04

0. 05

0. 06

0. 0

0. 00000

0. 00399

0. 00798

0. 01197

0. 01595

0. 01994

0. 1

0. 0398

0. 04380

0. 04776

0. 05172

0. 05567

0. 05966

0. 2

0. 0793

0. 08317

0. 08706

0. 09095

0. 09483

0. 09871

0. 3

0. 11791

0. 12172

0. 12552

0. 12930

0. 13307

0. 13683

0. 4

0. 15542

0. 15910

0. 16276

0. 16640

0. 17003

0. 17364

0. 5

0. 19146

0. 19497

0. 19847

0. 20194

0. 20540

0. 20884

0. 6

0. 22575

0. 22907

0. 23237

0. 23565

0. 23891

0. 24215

0. 7

0. 25804

0. 26115

0. 26424

0. 26730

0. 27035

0. 27337

… …

, rotunjiți-l la două zecimale (adică 0,24). Apoi verificați primele 2 cifre semnificative (0,2) în rând și pentru cifra cea mai puțin semnificativă (rămasă 0,4) în coloană. Acest lucru va duce la valoarea 0. 09483.

În tabelul de distribuție normal, cu o precizie de până la 5 zecimale pentru valorile de probabilitate (inclusiv cele pentru valorile negative), puteți găsi aici.

Să vedem câteva exemple de viață reală. Înălțimea persoanelor într-un grup mare urmează un model normal de distribuție. Să presupunem că avem un set de 100 de indivizi ale căror înălțimi sunt înregistrate, iar media și stddev sunt calculate la 66 și, respectiv, 6 inci.

Iată câteva întrebări care pot fi ușor de răspuns folosind tabelul cu valorile z:

Care este probabilitatea ca o persoană din grup să aibă 70 de centimetri sau mai puțin?

  • Întrebarea este de a găsi

valoarea cumulată a P (X <= 70) i. e. în întregul set de date de 100, câte valori vor fi între 0 și 70.

Să transformăm mai întâi valoarea X de 70 la valoarea Z echivalentă.

Z = (X - medie) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (runda cu 2 zecimale)

<= 0,67) = 0,24857 (din tabelul z de mai sus)

i. e. există o probabilitate de 24,857% ca o persoană din grup să fie mai mică sau egală cu 70 de inci.

Dar rămâneți în continuare - cele de mai sus sunt incomplete.Amintiți-vă, căutăm probabilitatea tuturor înălțimilor posibile până la 70 i. e. de la 0 la 70. Cele de mai sus vă oferă doar partea de la valoarea medie la valoarea dorită (adică 66 până la 70). Trebuie să includem cealaltă jumătate - de la 0 la 66 - pentru a ajunge la răspunsul corect.

Din moment ce 0 până la 66 reprezintă jumătatea porțiunii (adică una medie la mijloc), probabilitatea ei este pur 0. 0.

Prin urmare, probabilitatea corectă a unei persoane este de 70 inci sau mai mică = 0. 24857 + 0. 5 = 0,74857 =

74. 857% Grafic (prin calcularea zonei), acestea sunt cele două regiuni însumate reprezentând soluția:

Care este probabilitatea unei persoane de 75 inci sau mai mare?

  • i. e. Găsiți

Complementară cumulativă P (X> = 75). Z = (X - medie) / stddev = (75-66) / 6 = 9/6 = 1 5

P (Z> = 1,5) = 1- P (Z <= 1. 5) = 1 - (0. 5 + 0, 43319) = 0. 06681 = 6. 681%

Care este probabilitatea unei persoane să fie între 52 inchi și 67 inci?

  • Găsiți P (52 <= x <= 67).

P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p <-2,33 <= z <= 0. 17)

= P (Z <= 0,17) -p (Z <= -0,233) = (0,5 + 0,66749) -

tabelul de distribuție

(și valorile z) se găsește în mod obișnuit în cazul oricăror calcule de probabilitate privind mișcările de preț așteptate în stocul de acțiuni și indici. Acestea sunt utilizate în tranzacțiile bazate pe gamă, identificând trendul ascendent sau descendent, nivelurile de sprijin sau de rezistență și alți indicatori tehnici bazați pe conceptele normale de distribuție a deviației medii și standard.