Consilierul dvs. de investiții vă propune o schemă de investiții lunare care promite o întoarcere variabilă în fiecare lună. Veți investi în acesta numai dacă sunteți asigurat de o medie a venitului lunar de 180 USD. Consilierul dvs. vă informează, de asemenea, că, în ultimele 300 de luni, schema a revenit cu o valoare medie de 190 USD și o deviație standard de 75 USD. Ar trebui să investiți în acest sistem?
Testarea ipotezelor vine la ajutorul pentru astfel de decizii.
Acest articol presupune familiarizarea cititorilor cu conceptele unui tabel normal de distribuție, a formulei, a valorii p și a principiilor de bază ale statisticilor.
Testarea ipotezelor
(sau testarea semnificației) este un model matematic pentru testarea unei revendicări, a unei idei sau a unei ipoteze despre un parametru de interes într-un anumit set de populație, folosind datele măsurate într-un set de eșantioane. Calculele sunt efectuate pe eșantioane selectate pentru a aduna mai multe informații decisive despre caracteristicile întregii populații, ceea ce permite o modalitate sistematică de a testa afirmațiile sau ideile despre întregul set de date.
Există diferite metodologii pentru testarea ipotezelor. Următoarele patru etape de bază sunt implicate:
Pasul 1: Definirea ipotezei:
De obicei, valoarea raportată (sau statisticile revendicării) este declarată ca ipoteză și presupusă a fi adevărată. Pentru exemplele de mai sus, ipoteza va fi:
Exemplul A: Studenții din școală scor în medie 7 din 10 examene
- Exemplul B: Returnarea anuală a fondului mutual este de 8% pe an
- descrierea reprezintă "
Ipoteza nulă (H 0 ) " și este asumată ca fiind adevărată. Ca un proces al juriului începe prin asumarea nevinovăției suspectului urmată de determinarea dacă presupunerea este falsă. În mod similar, testarea ipotezelor începe prin afirmarea și asumarea "Ipotezei nul", iar apoi procesul determină dacă ipoteza este probabil să fie adevărată sau falsă. Punctul important de reținut este că testează ipoteza nulă deoarece există un element de îndoială cu privire la valabilitatea acesteia. Orice informație care se opune ipotezei nulte declarate este capturată în
Ipoteza alternativă (H 1 ). Pentru exemplele de mai sus, ipoteza alternativă va fi: Elevii înregistrează o medie care este
- nu egală cu 7 Rambursarea anuală a fondului mutual este
- nu la 8% pe an În rezumat, ipoteza alternativă este o contradicție directă a ipotezei nul.
La fel ca într-un proces, juriul își asumă nevinovăția suspectului (ipoteza nulă). Procurorul trebuie să dovedească altfel (alternativă). În mod similar, cercetătorul trebuie să demonstreze că ipoteza nulă este fie adevărată, fie falsă. Dacă procurorul nu reușește să demonstreze ipoteza alternativă, juriul trebuie să dea drumul "suspectului" (bazându-se pe o ipoteză nulă). În mod similar, dacă cercetătorul nu reușește să demonstreze ipoteza alternativă (sau pur și simplu nu face nimic), ipoteza nulă se presupune a fi adevărată.
Pasul 2: Stabiliți criteriile de decizie
Criteriile de luare a deciziilor trebuie să se bazeze pe anumiți parametri ai seturilor de date și în acest caz conexiunea cu distribuția normală intră în imagine.
Potrivit statisticilor statistice postulate despre distribuția eșantionării, "Pentru orice mărime de eșantion n, distribuția de eșantionare a lui X ^ este normală dacă populația X din care este extrasă eșantionul este distribuită în mod normal. "Prin urmare, probabilitățile de
toate celelalte mijloace de probă posibile pe care le puteți selecta sunt distribuite în mod normal. Pentru e. g. , determina dacă randamentul mediu zilnic al oricărei acțiuni listate pe bursa XYZ, în jurul valorii de Anul Nou, este mai mare de 2%.
H
0 : Ipoteza nulă: medie = 2% H
1 Luați eșantionul (de exemplu, 50 de stocuri din totalul de 500) și calculați media eșantionului. Pentru o distribuție normală, 95% din valori se situează în 2 deviații standard ale mediei populației. Prin urmare, această distribuție normală și ipoteza limită centrală pentru setul de date de probă ne permit să stabilim 5% ca nivel de semnificație. Are sens ca în această ipoteză, există o probabilitate mai mică de 5% (100-95) de a obține depășiri care depășesc 2 deviații standard față de media populației. În funcție de natura seturilor de date, alte niveluri de semnificație pot fi luate la 1%, 5% sau 10%. Pentru calculele financiare (inclusiv finanțarea comportamentală), 5% este limita general acceptată.
Dacă găsim calcule care depășesc abaterile standard 2 obișnuite, atunci avem un caz puternic de valori pentru a respinge ipoteza nulă.
Abaterile standard sunt extrem de importante pentru înțelegerea datelor statistice. Aflați mai multe despre ele vizionând videoclipul Investopedia privind abaterile standard. Din punct de vedere grafic, este reprezentat după cum urmează: În exemplul de mai sus, dacă media eșantionului este mult mai mare decât 2% (adică 3,5%), atunci respingem ipoteza nulă.Se acceptă ipoteza alternativă (medie> 2%), ceea ce confirmă faptul că randamentul mediu zilnic al stocurilor este într-adevăr peste 2%.
Cu toate acestea, dacă media eșantionului nu este susceptibilă să fie semnificativ mai mare decât 2% (și să rămână la aproximativ 2,2%), atunci nu putem respinge ipoteza nulă. Provocarea vizează modul de a decide asupra unor astfel de cazuri de apropiere. Pentru a realiza o concluzie din probele și rezultatele selectate, trebuie stabilit un nivel de semnificație
, ceea ce permite o concluzie privind ipoteza nulă. Ipoteza alternativă permite stabilirea nivelului de semnificație sau a conceptului "valoare critică" pentru a decide cu privire la astfel de cazuri de apropiere. În conformitate cu definiția standard, "O valoare critică este o valoare cutoff care definește granițele dincolo de care mai puțin de 5% În cazul exemplului de mai sus, dacă am definit valoarea critică ca fiind de 2,1%, și dacă am definit valoarea critică sub 2% calculat înseamnă 2,2%, apoi vom respinge ipoteza nulă.O valoare critică stabilește o delimitare clară în ceea ce privește acceptarea sau respingerea Mai multe exemple de urmat - În primul rând, totuși, să analizăm câțiva pași și concepte cheie. Pasul 3: Calculați statisticile de testare:
Această etapă implică calcularea cifrelor necesare, cunoscute sub numele de statistici de testare (cum ar fi media, scor Z, valoare p etc.) pentru eșantionul selectat. Sunt acoperite diferitele valori care trebuie calculate într-o secțiune ulterioară cu exemple.
Pasul 4: Faceți concluzii despre ipoteza
Cu valoarea (valorile) calculată, decideți despre ipoteza nulă. Dacă probabilitatea de a obține un eșantion mediu este mai mică de 5%, atunci concluzia este să
să respingă
ipoteza nulă. În caz contrar, acceptă și păstrează ipoteza nulă. Tipuri de erori la luarea deciziilor: Pot exista patru rezultate posibile în luarea deciziilor bazate pe eșantioane, în ceea ce privește aplicabilitatea corectă pentru întreaga populație:
Decizia de a păstra
Decizia de respingere > Se aplică întregii populații
Corect |
Incorect | |
(Eroare de tip 1 - a) |
Nu se aplică întregii populații |
Cazurile "corecte" sunt cele în care deciziile luate cu privire la eșantioane sunt cu adevărat aplicabile întregii populații. Cazurile de erori apar atunci când se decide să se păstreze (sau să se respingă) ipoteza nulă bazată pe calculele eșantionului, însă această decizie nu se aplică cu adevărat întregii populații. Aceste cazuri constituie erori de tip 1 (alfa) și de tip 2 (beta), așa cum se indică în tabelul de mai sus. |
Selectarea valorii critice corecte permite eliminarea erorilor de tip alfa-1 sau limitarea lor la un interval acceptabil. |
Alpha denotă eroarea la nivelul semnificației și este determinată de cercetător. Pentru a menține nivelul de semnificație sau nivelul de încredere standard de 5% pentru calculele de probabilitate, acest lucru este reținut la 5%. În conformitate cu criteriile și definițiile de luare a deciziilor aplicabile: |
"Acest criteriu (alfa) este de obicei setat la 0.05 (a = 0. 05), și vom compara nivelul alfa cu valoarea p. Atunci când probabilitatea unei erori tip I este mai mică de 5% (p <0.05), vom decide să respingem ipoteza nulă; în caz contrar, păstrăm ipoteza nulă. " |
Termenul tehnic folosit pentru această probabilitate este
valoarea p
. Este definită ca "probabilitatea obținerii unui rezultat al eșantionului, având în vedere că valoarea indicată în ipoteza nulă este adevărată. Valoarea p pentru obținerea rezultatului eșantionului este comparată cu nivelul de semnificație ".
O eroare de tip II sau o eroare beta este definită ca fiind "probabilitatea de reținere incorectă a ipotezei nulă, când, de fapt, ea nu este aplicabilă întregii populații. "
- Mai multe exemple vor demonstra acest lucru și alte calcule.
- Exemplul 1. Există o schemă de investiții lunare care promite venituri lunare variabile. Un investitor va investi în acesta doar dacă este asigurat de un venit mediu lunar de 180 USD. El are un eșantion de întoarce de 300 de luni, care are o medie de 190 de dolari și o deviație standard de 75 de dolari. Ar trebui să investească în acest sistem? Să rezolvăm problema. Investitorul va investi în sistem dacă este asigurat de rentabilitatea medie de 180 USD dorită. Aici, H
- 0
: Ipoteza nulă: medie = 180
H
1
: Identificați o valoare critică X L
pentru media eșantionului, care este suficient de mare pentru a respinge ipoteza nulă - i. e. respingeți ipoteza nulă dacă valoarea mediei eșantionului> = valoarea critică X L P (identificați o eroare alfa de tip I) = P (respinge H
0 este adevărat),
care ar fi obținut atunci când media eșantionului depășește limitele critice i. e. = P (dat fiind că H 0 este adevărat) = alfa
grafic, Z = 0. 05 = 1. 645 (din tabelul Z sau tabela de distribuție normală) => X L
= 180 +1. 645 * (75 / sqrt (300)) = 187. 12
Deoarece media eșantionului (190) este mai mare decât valoarea critică (187.12), ipoteza nulă este respinsă. mai mult de 180 de dolari, deci investitorul poate lua în considerare investiția în acest sistem. Metoda 2 - Utilizarea statisticilor de testare standardizate :
De asemenea, se poate utiliza valoarea standardizată z.
Testarea statistică, Z = (media eșantionului - media populației) / (std-dev / sqrt (nr. 75 / sqrt (300)) = 2. 309 Regiunea noastră de respingere la nivel de semnificație 5% este Z> Z 0. 05
= 1. 645 (9)> Metoda 3 - Calculul valorii P: Vom încerca să identificăm P (media eșantionului = = 190, atunci când media = 180)
= P (Z> = (190-180) / (75 / sqrt (300))
= P (Z> = 2.309) pentru a deduce calculele valorii p, se concluzionează că există dovezi confirmate că randamentul mediu lunar este mai mare de 180. Valoare p
Inferență
mai mică de 1%
Dovezi confirmate
care susțin ipoteza alternativă
între 1% și 5% > între 5% și 10% Dovezi slabe
susținând ipoteza alternativă
mai mare de 10%
Nu există dovezi
susținând ipoteza alternativă
că ratele de brokeraj sunt mai mici decât cele ale brokerului dvs. de acțiuni curent (ABC). Datele disponibile de la o firmă independentă de cercetare indică faptul că media și std-dev a tuturor clienților ABC broker sunt de 18 $ și respectiv 6 $.
Se prelevează un eșantion de 100 de clienți ABC, iar taxele de brokeraj se calculează cu noile rate ale brokerului XYZ. Dacă media eșantionului este de 18 USD. 75 și std-dev este aceeași ($ 6), se poate face orice inferență cu privire la diferența dintre factura medie de brokeraj dintre brokerul ABC și XYZ?
H |
0 |
: Ipoteza nulă: medie = 18 |
H 1 |
: Ipoteza alternativă: Z <= - z |
2. 5 și Z> = Z |
2. 5 |
(presupunând un nivel de semnificație de 5%, împărțit pe 2 pe fiecare parte) Z = (medie de eșantion - medie) / (std-dev / sqrt (100)) = 1. 25 |
Această valoare Z calculată se situează între cele două limite definite de |
- Z 2. 5 |
= -1 96 și Z
2. 5
= 1. 96. Aceasta concluzionează că nu există suficiente dovezi pentru a concluziona că există diferențe între ratele brokerului dvs. existent și cel nou Valoarea p = P (Z1.25)
= 2 * 0. 1056 = 0.2112 = 21. 12%, care este mai mare de 0.05 sau 5%, conducând la aceeași concluzie. , este reprezentată de următoarele: Puncte de critică pentru metoda de testare ipotetică: -
Metoda statistică bazată pe ipoteze - Eroare predispusă la fel de detaliată în ceea ce privește erorile alfa și beta din valoarea p poate fi ambiguă, conducând la rezultate confuze Linia de fund Testarea ipotezelor permite unui model matematic să valideze o revendicare sau o idee cu un anumit nivel de încredere. Cu toate acestea, ca majoritatea instrumentelor și modelelor statistice, acest lucru este legat de câteva limitări. Utilizarea acestui model pentru luarea deciziilor financiare ar trebui luată în considerare în mod critic, ținând cont de toate dependențele. Metodele alternative cum ar fi Inferența Bayesian merită, de asemenea, explorate pentru analize similare.
Un ghid al investitorilor pentru testarea stresului bancar
Cum se efectuează testele de stres bancare și care este logica din spatele lor? Și este un test de stres util pentru evaluarea stocului unei bănci?
Ce este testarea utilizabilității și de ce este atât de importantă în sectorul internetului? Investopedia
Aflați de ce o companie ar dori să efectueze un test de utilizare și ce tipuri de date și informații devin disponibile cu acest test.
Sunt contribuțiile de recuperare incluse în testarea reală a amânării (ADP)?
Aflați de ce nu sunt incluse contribuțiile suplimentare în procesul de testare ADP și cum utilizează IRS testele de nediscriminare pentru a egaliza condițiile de joc.