Calcule
Cum se calculează nivelul de semnificație statistică. Explicați ce este un nivel de semnificație statistică

Cum se calculează nivelul de semnificație statistică. Explicați ce este un nivel de semnificație statistică

Parametrii de distribuție a probei determinați printr-o serie de măsurători sunt variabile aleatorii, prin urmare, abaterile lor de la parametrii generali vor fi și ele aleatorii. Evaluarea acestor abateri este de natură probabilistică - în analiza statistică, se poate indica doar probabilitatea unei anumite erori.

Lăsați pentru parametrul general A derivat din estimare imparțială din experiență A*. Atribuim o probabilitate b suficient de mare (astfel încât un eveniment cu probabilitatea b poate fi considerat practic sigur) și găsim o astfel de valoare e b = f(b) pentru care

Gama de valori practic posibile ale erorii care apare la înlocuire A pe A* , va fi ±e b . Erorile care sunt mari în valoare absolută vor apărea doar cu o probabilitate mică.

numit nivelul de semnificație. În caz contrar, expresia (4.1) poate fi interpretată ca probabilitatea ca valoarea adevărată a parametrului A se află înăuntru

. (4.3)

Probabilitatea b se numește nivel de încredereşi caracterizează fiabilitatea estimării obţinute. Interval eu b= A* ± e b se numește interval de încredere. Limite de interval A¢ = A* - e b și A¢¢ = A* + e b sunt numite limitele de încredere. Intervalul de încredere la un anumit nivel de încredere determină acuratețea estimării. Valoarea intervalului de încredere depinde de nivelul de încredere cu care se garantează găsirea parametrului Aîn interiorul intervalului de încredere: cu cât valoarea lui b este mai mare, cu atât intervalul este mai mare eu b (și valoarea lui e b). O creștere a numărului de experimente se manifestă printr-o reducere a intervalului de încredere cu o probabilitate de încredere constantă sau printr-o creștere a probabilității de încredere cu menținerea intervalului de încredere.

În practică, se fixează de obicei valoarea probabilității de încredere (0,9; 0,95 sau 0,99) și apoi se determină intervalul de încredere al rezultatului eu b. La construirea unui interval de încredere, se rezolvă problema abaterii absolute:

Astfel, dacă era cunoscută legea de distribuţie a devizului A* , sarcina de a determina intervalul de încredere ar fi rezolvată simplu. Luați în considerare construcția unui interval de încredere pentru așteptarea matematică a unei variabile aleatoare distribuite normal X cu un standard general cunoscut pe o dimensiune a eșantionului n. Cel mai bine legat pentru așteptări m este media eșantionului cu abaterea standard a mediei

Folosind funcția Laplace, obținem

. (4.5)

Având în vedere probabilitatea de încredere b, determinăm valoarea din tabelul funcției Laplace (Anexa 1) . Apoi, intervalul de încredere pentru așteptarea matematică ia forma

. (4.7)

Din (4.7) se poate observa că scăderea intervalului de încredere este invers proporțională cu rădăcina pătrată a numărului de experimente.

Cunoașterea varianței generale ne permite să estimăm așteptările matematice chiar și pentru o singură observație. Dacă pentru o variabilă aleatoare distribuită normal X ca rezultat al experimentului, valoarea X 1, atunci intervalul de încredere pentru așteptarea matematică pentru b ales are forma

Unde U 1-p/2 - cuantila distribuției normale standard (Anexa 2).

Legea distribuirii gradelor A* depinde de legea de distribuție a cantității Xși, în special, asupra parametrului în sine A. Pentru a evita această dificultate, în statistica matematică sunt utilizate două metode:

1) aproximativ - la n³ 50 înlocuiți parametrii necunoscuți din expresia pentru e b cu estimările lor, de exemplu:

2) dintr-o variabilă aleatoare A* mergeți la o altă variabilă aleatoare Q * , a cărei lege de distribuție nu depinde de parametrul estimat A, dar depinde doar de dimensiunea eșantionului. nși asupra tipului de lege de distribuție a cantității X. Cantitățile de acest fel au fost studiate în cele mai multe detalii pentru distribuția normală a variabilelor aleatoare. Cuantilele simetrice sunt de obicei folosite ca limite de încredere pentru Q¢ și Q¢¢

, (4.9)

sau luând în considerare (4.2)

. (4.10)

4.2. Testarea ipotezelor statistice, teste de semnificație,

erori de primul și al doilea fel.

Sub ipotezele statistice sunt înțelese unele ipoteze despre distribuțiile populației generale ale uneia sau altei variabile aleatoare. Testarea ipotezelor este înțeleasă ca o comparație a unor indicatori statistici, criteriile de verificare (criterii de semnificație) calculate din eșantion, cu valorile lor determinate în ipoteza că ipoteza dată este adevărată. Când se testează ipoteze, unele ipoteze sunt de obicei testate. H 0 în comparație cu ipoteza alternativă H 1 .

Pentru a decide dacă se acceptă sau se respinge o ipoteză, este dat nivelul de semnificație R. Cele mai frecvent utilizate niveluri de semnificație sunt 0,10, 0,05 și 0,01. Conform acestei probabilități, folosind ipoteza despre distribuția estimării Q* (criteriul semnificației), se găsesc limite de încredere cuantile, de regulă, Q simetrice. p/2 și Q 1- p/2 . numere Q p/2 și Q 1- p/2 sunt numite valorile critice ale ipotezei; valori Q*< Qp/2 și Q * > Q 1- p/2 formează un critic

zona ipotezei (sau zona de neacceptare a ipotezei) (Fig. 12).

Orez. 12. Zona critică Orez. 13. Verificarea statisticilor

ipoteze. ipoteze.

Dacă Q 0 găsit în eșantion se încadrează între Q p/2 și Q 1- p/2 , atunci ipoteza admite o astfel de valoare ca fiind aleatorie și, prin urmare, nu există motive pentru respingerea ei. Dacă valoarea lui Q 0 se încadrează în regiunea critică, atunci, conform acestei ipoteze, este practic imposibil. Dar de când a apărut, ipoteza în sine este respinsă.

Există două tipuri de erori care pot fi făcute la testarea ipotezelor. Eroare de tip I este asta respingând o ipoteză care este de fapt adevărată. Probabilitatea unei astfel de erori nu este mai mare decât nivelul de semnificație acceptat. Eroare de tip II este asta ipoteza este acceptată, dar de fapt este falsă. Probabilitatea acestei erori este cu cât este mai mică, cu atât este mai mare nivelul de semnificație, deoarece aceasta crește numărul de ipoteze respinse. Dacă probabilitatea unei erori de al doilea fel este a, atunci se numește valoarea (1 - a). puterea criteriului.

Pe fig. 13 prezintă două curbe ale densității de distribuție a variabilei aleatoare Q, corespunzătoare a două ipoteze H 0 și H unu . Dacă valoarea obținută din experiență este Q > Q p, atunci ipoteza este respinsă. H 0 și ipoteza este acceptată H 1 și invers, dacă Q< Qp.

Aria de sub curba densității probabilității corespunzătoare validității ipotezei H 0 la dreapta valorii Q p, este egal cu nivelul de semnificație R, adică probabilitățile unei erori de primul fel. Aria de sub curba densității probabilității corespunzătoare validității ipotezei H 1 la stânga lui Q p, este egală cu probabilitatea de eroare de al doilea fel a și la dreapta lui Q p- puterea criteriului (1 - a). Astfel, cu atât mai mult R, cu atât mai mult (1 - a). Atunci când testează o ipoteză, ei încearcă să aleagă dintre toate criteriile posibile pe cel care, la un anumit nivel de semnificație, are o probabilitate mai mică de eroare de tip II..

De obicei, ca nivel optim de semnificație la testarea ipotezelor, utilizați p= 0,05, deoarece dacă ipoteza testată este acceptată cu un anumit nivel de semnificație, atunci ipoteza, desigur, ar trebui recunoscută ca fiind în concordanță cu datele experimentale; pe de altă parte, utilizarea acestui nivel de semnificație nu oferă motive pentru respingerea ipotezei.

De exemplu, se găsesc două valori ale și un parametru eșantion, care pot fi considerate estimări ale parametrilor generali A 1 și A 2. Se presupune că diferența dintre și este aleatorie și că parametrii generali A 1 și A 2 sunt egale între ele, adică A 1 = A 2. Această ipoteză se numește nul, sau ipoteza nulă. Pentru a-l testa, trebuie să aflați dacă discrepanța dintre și este semnificativă în ipoteza nulă. Pentru a face acest lucru, se investighează de obicei o variabilă aleatoare D = – și se verifică dacă diferența ei față de zero este semnificativă. Uneori este mai convenabil să luați în considerare valoarea / comparând-o cu unitatea.

Respingând ipoteza nulă, o acceptă pe cea alternativă, care se împarte în două: > și< . Если одно из этих равенств заведомо невозможно, то альтернативная гипотеза называется unilateral, iar pentru a-l verifica, utilizați unilateral criterii de semnificație (spre deosebire de cele convenționale, bilateral). În acest caz, este necesar să se ia în considerare doar una dintre jumătățile regiunii critice (Fig. 12).

De exemplu, R= 0,05 cu un criteriu cu două fețe, valorile critice Q 0,025 și Q 0,975 corespund, adică Q * care au luat valorile Q * sunt considerate semnificative (nealeatoare)< Q 0.025 и Q * >Q 0,975. Cu un criteriu unilateral, una dintre aceste inegalități este evident imposibilă (de exemplu, Q *< Q 0.025) и значимыми будут лишь Q * >Q 0,975. Probabilitatea ultimei inegalități este 0,025 și, prin urmare, nivelul de semnificație va fi 0,025. Astfel, dacă pentru testul de semnificație cu o singură coadă sunt utilizate aceleași numere critice ca și pentru cel cu două cozi, aceste valori vor corespunde la jumătatea nivelului de semnificație.

De obicei, pentru un test cu o singură coadă, se ia același nivel de semnificație ca și pentru un test cu două cozi, deoarece în aceste condiții ambele teste oferă aceeași eroare de tip I. Pentru a face acest lucru, un test cu o singură coadă trebuie să fie derivat dintr-unul cu două cozi, corespunzător unui nivel de semnificație de două ori mai mare decât cel acceptat.. Pentru a menține un nivel de semnificație pentru un test cu o singură coadă R= 0,05, pentru bilateral este necesar să se ia R= 0,10, care dă valorile critice Q 0,05 și Q 0,95. Dintre acestea, pentru un test unilateral, unul va rămâne, de exemplu, Q 0,95. Nivelul de semnificație pentru testul cu o singură coadă este 0,05. Același nivel de semnificație pentru testul cu două cozi corespunde valorii critice Q 0,975. Dar Q 0,95< Q 0.975 , значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода.

Nivelul de semnificație în statistică este un indicator important care reflectă gradul de încredere în acuratețea și adevărul datelor primite (prevăzute). Conceptul este utilizat pe scară largă în diverse domenii: de la cercetarea sociologică până la testarea statistică a ipotezelor științifice.

Definiție

Nivelul de semnificație statistică (sau rezultatul semnificativ statistic) arată care este probabilitatea de apariție aleatorie a indicatorilor studiați. Semnificația statistică generală a fenomenului este exprimată prin valoarea p (nivelul p). În orice experiment sau observație, există posibilitatea ca datele obținute să apară din cauza erorilor de eșantionare. Acest lucru este valabil mai ales pentru sociologie.

Adică o valoare este semnificativă statistic, a cărei probabilitate de apariție aleatorie este extrem de mică sau tinde spre extreme. Extrema în acest context este gradul de abatere a statisticilor de la ipoteza nulă (o ipoteză care este testată pentru coerența cu datele eșantionului obținute). În practica științifică, nivelul de semnificație este ales înainte de colectarea datelor și, de regulă, coeficientul acestuia este de 0,05 (5%). Pentru sistemele în care valorile precise sunt critice, aceasta poate fi de 0,01 (1%) sau mai puțin.

fundal

Conceptul de nivel de semnificație a fost introdus de statisticianul și geneticianul britanic Ronald Fisher în 1925, când dezvolta o tehnică de testare a ipotezelor statistice. Când se analizează orice proces, există o anumită probabilitate pentru anumite fenomene. Dificultățile apar atunci când se lucrează cu procente mici (sau nu evidente) de probabilități care se încadrează sub conceptul de „eroare de măsurare”.

Când lucrau cu statistici care nu erau suficient de specifice pentru a fi testate, oamenii de știință s-au confruntat cu problema ipotezei nule, care „împiedecă” operarea cu valori mici. Fisher a propus ca astfel de sisteme să determine probabilitatea evenimentelor la 5% (0,05) ca o limită convenabilă a eșantionului care permite respingerea ipotezei nule în calcule.

Introducerea unui coeficient fix

În 1933 Oamenii de știință Jerzy Neumann și Egon Pearson în lucrările lor au recomandat stabilirea unui anumit nivel de semnificație în avans (înainte de colectarea datelor). Exemple de utilizare a acestor reguli sunt clar vizibile în timpul alegerilor. Să presupunem că există doi candidați, dintre care unul este foarte popular, iar celălalt nu este bine cunoscut. Este evident că primul candidat va câștiga alegerile, iar șansele celui de-al doilea tind la zero. Străduiți-vă - dar nu egal: există întotdeauna posibilitatea de forță majoră, informații senzaționale, decizii neașteptate care pot modifica rezultatele alegerilor prezise.

Neumann și Pearson au fost de acord că nivelul de semnificație propus de Fisher de 0,05 (notat prin simbolul α) este cel mai convenabil. Cu toate acestea, Fischer însuși în 1956 s-a opus fixării acestei valori. El credea că nivelul α ar trebui stabilit în conformitate cu circumstanțe specifice. De exemplu, în fizica particulelor este 0,01.

valoarea p

Termenul de valoare p a fost folosit pentru prima dată de Brownlee în 1960. P-level (p-valoarea) este un indicator care este invers legat de adevărul rezultatelor. Cea mai mare valoare p corespunde celui mai scăzut nivel de încredere în relația eșantionată dintre variabile.

Această valoare reflectă probabilitatea erorilor asociate cu interpretarea rezultatelor. Presupunem valoarea p = 0,05 (1/20). Arată o șansă de cinci procente ca relația dintre variabilele găsite în eșantion să fie doar o caracteristică aleatorie a eșantionului. Adică, dacă această dependență este absentă, atunci cu experimente similare repetate, în medie, în fiecare al douăzecilea studiu, se poate aștepta la aceeași dependență sau mai mare între variabile. Adesea, nivelul p este considerat „marja” nivelului de eroare.

Apropo, valoarea p poate să nu reflecte relația reală dintre variabile, ci arată doar o anumită valoare medie în cadrul ipotezelor. În special, analiza finală a datelor va depinde și de valorile alese ale acestui coeficient. Cu p-level = 0,05 vor fi unele rezultate, iar cu un coeficient egal cu 0,01, altele.

Testarea ipotezelor statistice

Nivelul de semnificație statistică este deosebit de important atunci când se testează ipoteze. De exemplu, atunci când se calculează un test cu două cozi, aria de respingere este împărțită în mod egal la ambele capete ale distribuției de eșantionare (față de coordonata zero) și se calculează adevărul datelor obținute.

Să presupunem că, la monitorizarea unui anumit proces (fenomen), s-a dovedit că informațiile statistice noi indică modificări mici în raport cu valorile anterioare. În același timp, discrepanțele în rezultate sunt mici, nu evidente, dar importante pentru studiu. Specialistul se confruntă cu o dilemă: modificările apar cu adevărat sau sunt erori de eșantionare (inecizie de măsurare)?

În acest caz, se aplică sau se respinge ipoteza nulă (totul este anulat ca o eroare, sau schimbarea în sistem este recunoscută ca un fapt împlinit). Procesul de rezolvare a problemei se bazează pe raportul dintre semnificația statistică globală (valoarea p) și nivelul de semnificație (α). Dacă nivelul p< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Valori folosite

Nivelul de semnificație depinde de materialul analizat. În practică, se folosesc următoarele valori fixe:

a = 0,1 (sau 10%);
a = 0,05 (sau 5%);
a = 0,01 (sau 1%);
α = 0,001 (sau 0,1%).

Cu cât sunt necesare calculele mai precise, cu atât coeficientul α este mai mic. Desigur, prognozele statistice din fizică, chimie, farmaceutică și genetică necesită o precizie mai mare decât în știința politică și sociologie.

Praguri de semnificație în anumite zone

În domenii de înaltă precizie, cum ar fi fizica particulelor și producție, semnificația statistică este adesea exprimată ca raport dintre abaterea standard (notată prin coeficientul sigma - σ) față de o distribuție normală de probabilitate (distribuția Gauss). σ este un indicator statistic care determină răspândirea valorilor unei anumite cantități în raport cu așteptările matematice. Folosit pentru a reprezenta grafic probabilitatea evenimentelor.

În funcție de domeniul de cunoaștere, coeficientul σ variază foarte mult. De exemplu, la prezicerea existenței bosonului Higgs, parametrul σ este egal cu cinci (σ=5), ceea ce corespunde valorii p=1/3,5 milioane de zone.

Eficienţă

Trebuie avut în vedere faptul că coeficienții α și p-valoarea nu sunt caracteristici exacte. Oricare ar fi nivelul de semnificație în statistica fenomenului studiat, nu este o bază necondiționată pentru acceptarea ipotezei. De exemplu, cu cât valoarea lui α este mai mică, cu atât este mai mare șansa ca ipoteza care se stabilește să fie semnificativă. Cu toate acestea, există riscul de eroare, care reduce puterea statistică (semnificația) studiului.

Cercetătorii care se concentrează exclusiv pe rezultate semnificative statistic pot trage concluzii eronate. În același timp, este dificil să-și verifice munca, deoarece aplică ipoteze (care, de fapt, sunt valorile valorii α și p). Prin urmare, se recomandă întotdeauna, împreună cu calculul semnificației statistice, să se determine un alt indicator - amploarea efectului statistic. Mărimea efectului este o măsură cantitativă a puterii unui efect.

Valoarea este numită semnificativ din punct de vedere statistic, dacă probabilitatea unei apariții pur aleatoare a acesteia sau chiar a unor valori mai extreme este mică. Aici, extrem este gradul de abatere de la ipoteza nulă. Se spune că o diferență este „semnificativă din punct de vedere statistic” dacă există date care ar fi puțin probabil să apară, presupunând că diferența nu există; această expresie nu înseamnă că această diferență ar trebui să fie mare, importantă sau semnificativă în sensul general al cuvântului.

Nivelul de semnificație al unui test este noțiunea tradițională de testare a ipotezelor în statisticile de frecvență. Este definită ca probabilitatea de a decide respingerea ipotezei nule dacă, de fapt, ipoteza nulă este adevărată (decizia este cunoscută ca eroare de tip I sau decizie fals pozitivă.) Procesul de decizie se bazează adesea pe o valoare p (a se citi „valoarea pi”): dacă valoarea p este mai mică decât nivelul de semnificație, atunci ipoteza nulă este respinsă. Cu cât valoarea p este mai mică, cu atât se spune că statistica testului este mai semnificativă. Cu cât valoarea p este mai mică, cu atât este mai puternic motivul pentru a respinge ipoteza nulă.

Nivelul de semnificație este de obicei notat cu litera greacă α (alfa). Nivelurile de semnificație populare sunt 5%, 1% și 0,1%. Dacă testul produce o valoare p mai mică decât nivelul α, atunci ipoteza nulă este respinsă. Astfel de rezultate sunt denumite în mod informal „semnificative statistic”. De exemplu, dacă cineva spune că „șansele a ceea ce s-a întâmplat este o coincidență egală cu unu la o mie”, atunci înseamnă un nivel de semnificație de 0,1%.

Diferite valori ale nivelului α au avantajele și dezavantajele lor. Nivelurile α mai mici dau mai multă încredere că o ipoteză alternativă deja stabilită este semnificativă, dar există un risc mai mare de a nu respinge o ipoteză falsă nulă (eroare de tip II sau „decizie fals negativă”) și, prin urmare, o putere statistică mai mică. Alegerea nivelului α necesită inevitabil un compromis între semnificație și putere și, prin urmare, între probabilitățile de eroare de tip I și de tip II. În casă lucrări științifice adesea se folosește termenul incorect „semnificație” în locul termenului „semnificație statistică”.

Vezi si

Note

George Casella, Roger L. Berger Testarea ipotezelor // Inferența statistică . -A doua editie. - Pacific Grove, CA: Duxbury, 2002. - S. 397. - 660 p. - ISBN 0-534-24312-6

Fundația Wikimedia. 2010 .

Vedeți care este „Nivelul de semnificație” în alte dicționare:

Numărul este atât de mic încât se poate considera aproape sigur că un eveniment cu probabilitate α nu va avea loc într-un singur experiment. De obicei U. z. se fixeaza arbitrar si anume: 0,05, 0,01, si cu precizie deosebita 0,005 etc.In geol. muncă… … Enciclopedia Geologică

nivelul de semnificație- criteriul statistic (se mai numește și „nivel alfa” și notat cu o literă greacă) este o limită superioară a probabilității unei erori de tip I (probabilitatea respingerii unei ipoteze nule atunci când este adevărată). Valorile tipice sunt... Dicţionar de statistică sociologică

Engleză nivel, semnificație; limba germana Signifikanzniveau. Gradul de risc este acela că cercetătorul poate trage o concluzie greșită cu privire la eroarea figuranților, ipoteze bazate pe date din eșantion. antinazi. Enciclopedia de Sociologie, 2009... Enciclopedia Sociologiei

nivelul de semnificație- - [L.G. Sumenko. Dicționar englez rus de tehnologii informaționale. M .: GP TsNIIS, 2003.] Subiecte tehnologia informației în general nivelul de semnificație EN ... Manualul Traducătorului Tehnic

nivelul de semnificație- 3.31 nivel de semnificație α: O valoare dată reprezentând limita superioară a probabilității de respingere a unei ipoteze statistice atunci când acea ipoteză este adevărată. Sursa: GOST R ISO 12491 2011: Materiale și produse de construcții. ...... Dicționar-carte de referință de termeni ai documentației normative și tehnice

NIVEL DE SEMNIFICAȚIE- conceptul de statistică matematică, care reflectă gradul de probabilitate a unei concluzii eronate cu privire la o ipoteză statistică despre distribuția unei caracteristici, verificată pe baza datelor eșantionului. În cercetarea psihologică pentru un nivel suficient ...... Modern proces educațional: concepte și termeni de bază

nivelul de semnificație- reikšmingumo lygis statusas T sritis automatika atitikmenys: engl. nivel de semnificație vok. Signifikanzniveau, n rus. nivel de semnificație, m pranc. niveau de signifiance, m … Automatikos terminų žodynas

nivelul de semnificație- reikšmingumo lygis statusas T sritis fizika atitikmenys: engl. nivelul de semnificație; nivel de semnificație vok. Sicherheitsschwelle, f rus. nivel de semnificație, fpranc. nivel de semnificație, m … Fizikos terminų žodynas

Test statistic, vezi Nivel de semnificație... Marea Enciclopedie Sovietică

NIVEL DE SEMNIFICAȚIE- Vezi semnificația, nivelul... Dicţionarîn psihologie

Cărți

„Top secret”. Lubianka - lui Stalin despre situația din țară (1922-1934). Volumul 4. Partea 1,. Publicare fundamentală în mai multe volume de lucrări - recenzii de informațiiși rezumate ale OGPU - este unică în semnificația sa științifică, valoarea, conținutul și domeniul de aplicare. În acest istoric…
Program educațional ca instrument pentru sistemul de management al calității învățământului profesional, Tkacheva Galina Viktorovna, Logachev Maxim Sergeevich, Samarin Yury Nikolaevich. Monografia analizează practicile existente de formare a conținutului programelor de învățământ profesional. Locul, structura, conținutul și nivelul de semnificație sunt determinate...

valoarea p(ing.) - valoarea folosită la testarea ipotezelor statistice. De fapt, aceasta este probabilitatea de eroare la respingerea ipotezei nule (eroarea de primul fel). Testarea ipotezelor folosind valoarea P este o alternativă la procedura clasică de testare prin valoarea critică a distribuției.

De obicei, valoarea P este egală cu probabilitatea ca o variabilă aleatoare cu o distribuție dată (distribuția statisticii test în ipoteza nulă) să ia o valoare nu mai mică decât valoarea reală a statisticii test. Wikipedia.

Cu alte cuvinte, valoarea p este cel mai mic nivel de semnificație (adică probabilitatea de respingere a unei ipoteze adevărate) pentru care statistica de test calculată duce la respingerea ipotezei nule. De obicei, valoarea p este comparată cu nivelurile de semnificație standard acceptate în general de 0,005 sau 0,01.

De exemplu, dacă valoarea statisticii de test calculată din eșantion corespunde cu p = 0,005, aceasta indică o probabilitate de 0,5% ca ipoteza să fie adevărată. Astfel, cu cât valoarea p este mai mică, cu atât mai bine, deoarece crește „puterea” respingerii ipotezei nule și crește semnificația așteptată a rezultatului.

O explicație interesantă a acestui lucru este pe Habré.

Analiza statistică începe să arate ca o cutie neagră: intrarea este date, rezultatul este un tabel cu principalele rezultate și o valoare p.

Ce spune valoarea p?

Să presupunem că am decis să aflăm dacă există o relație între dependența de jocurile pe computer și agresivitate în viața reală. Pentru aceasta, s-au format aleatoriu două grupe de școlari de câte 100 de persoane fiecare (grupa 1 - fani shooter, grupa 2 - nu joacă jocuri pe calculator). De exemplu, numărul de lupte cu colegii acționează ca un indicator al agresivității. În studiul nostru imaginar, s-a dovedit că grupul de școlari-jucători de noroc s-a confruntat cu camarazii lor mult mai des. Dar cum aflăm cât de semnificative statistic sunt diferențele rezultate? Poate că am obținut diferența observată din întâmplare? Pentru a răspunde la aceste întrebări, se folosește valoarea p - aceasta este probabilitatea de a obține astfel de diferențe sau mai pronunțate, cu condiția ca de fapt să nu existe diferențe în populația generală. Cu alte cuvinte, aceasta este probabilitatea de a obține astfel de diferențe sau chiar mai puternice între grupurile noastre, cu condiția ca, de fapt, jocurile pe calculator să nu afecteze în niciun fel agresivitatea. Nu sună atât de greu. Cu toate acestea, această statistică este adesea interpretată greșit.

exemple de valoare p

Așadar, am comparat două grupuri de școlari între ei în ceea ce privește nivelul de agresivitate folosind un test t standard (sau un test Chi neparametric - pătratul celui mai potrivit în această situație) și am constatat că râvnitul p- nivelul de semnificație este mai mic de 0,05 (de exemplu, 0,04). Dar ce ne spune de fapt valoarea p-semnificației rezultată? Deci, dacă valoarea p este probabilitatea de a obține astfel de diferențe sau mai pronunțate, cu condiția ca de fapt să nu existe diferențe în populația generală, atunci care credeți că este afirmația corectă:

1. Jocurile pe calculator sunt cauza comportamentului agresiv cu o probabilitate de 96%.
2. Probabilitatea ca agresivitatea și jocurile pe calculator să nu fie legate este de 0,04.
3. Dacă am obține un p-nivel de semnificație mai mare de 0,05, aceasta ar însemna că agresivitatea și jocurile pe calculator nu sunt legate în niciun fel.
4. Probabilitatea de a obține astfel de diferențe din întâmplare este de 0,04.
5. Toate afirmațiile sunt greșite.

Daca ai ales varianta a cincea, atunci ai perfecta dreptate! Dar, după cum arată numeroase studii, chiar și oamenii cu experiență semnificativă în analiza datelor interpretează adesea greșit valorile p.

Să luăm fiecare răspuns în ordine:

Prima afirmație este un exemplu de eroare de corelare: faptul că două variabile sunt legate semnificativ nu ne spune nimic despre cauză și efect. Poate că oamenii mai agresivi preferă să-și petreacă timpul jucând jocuri pe computer și nu jocurile pe computer îi fac pe oameni mai agresivi.

Aceasta este o afirmație mai interesantă. Chestia este că inițial luăm de la sine înțeles că într-adevăr nu există diferențe. Și, ținând cont de acest lucru ca fapt, calculăm valoarea p. Prin urmare, interpretarea corectă este: „Presupunând că agresivitatea și jocurile pe calculator nu sunt legate în niciun fel, atunci probabilitatea de a obține astfel de diferențe sau chiar mai pronunțate a fost de 0,04”.

Dar dacă avem diferențe nesemnificative? Înseamnă aceasta că nu există nicio relație între variabilele studiate? Nu, înseamnă doar că pot exista diferențe, dar rezultatele noastre nu ne-au permis să le detectăm.

Acest lucru este direct legat de definiția valorii p în sine. 0,04 este probabilitatea de a obține aceste diferențe sau chiar mai multe extreme. În principiu, este imposibil să se estimeze probabilitatea de a obține exact astfel de diferențe ca în experimentul nostru!

Acestea sunt capcanele care pot fi ascunse în interpretarea unui astfel de indicator ca valoare p. Prin urmare, este foarte important să înțelegem mecanismele care stau la baza metodelor de analiză și calcul a principalilor indicatori statistici.

Cum să găsiți valoarea p?

1. Determinați rezultatele așteptate ale experimentului dvs

De obicei, atunci când oamenii de știință efectuează un experiment, ei au deja o idee despre rezultatele pe care trebuie să le considere „normale” sau „tipice”. Acest lucru se poate baza pe rezultatele experimentale ale experimentelor anterioare, pe seturi de date de încredere, pe date din literatura științifică sau omul de știință se poate baza pe alte surse. Pentru experimentul dvs., definiți rezultatele așteptate și exprimați-le ca numere.

Exemplu: De exemplu, studiile anterioare au arătat că, în țara dvs., mașinile roșii au șanse mai mari să primească amenzi de viteză decât mașinile albastre. De exemplu, scorurile medii arată o preferință de 2:1 pentru mașinile roșii față de cele albastre. Dorim să stabilim dacă poliția are aceleași prejudecăți față de culoarea mașinilor din orașul dvs. Pentru aceasta, vom analiza amenzile emise pentru depășirea vitezei. Dacă luăm aleatoriu un set de 150 de amenzi de viteză emise fie pentru mașini roșii, fie pentru mașini albastre, ne-am aștepta să fie emise 100 de bilete pentru mașini roșii și 50 pentru albastre, dacă poliția din orașul nostru este la fel de părtinitoare față de culoarea mașinilor așa cum s-a observat. prin tara.

2. Determinați rezultatele observabile ale experimentului dvs

Acum că ați determinat rezultatele așteptate, trebuie să experimentați și să găsiți valorile reale (sau „observate”). Trebuie să reprezentați din nou aceste rezultate ca numere. Dacă creăm condiții experimentale, iar rezultatele observate diferă de cele așteptate, atunci avem două posibilități - fie aceasta s-a întâmplat întâmplător, fie aceasta este cauzată tocmai de experimentul nostru. Scopul găsirii valorii p este tocmai acela de a determina dacă rezultatele observate diferă de cele așteptate în așa fel încât să nu se poată respinge „ipoteza nulă” – ipoteza că nu există nicio relație între variabilele experimentale și cele observate. rezultate.

Exemplu: De exemplu, în orașul nostru, am selectat aleatoriu 150 de amenzi de viteză care au fost emise fie pentru mașini roșii, fie pentru mașini albastre. Am stabilit că au fost emise 90 de bilete pentru mașini roșii și 60 pentru cele albastre. Acesta este diferit de rezultatele așteptate, care sunt 100 și, respectiv, 50. Experimentul nostru (în acest caz, schimbarea sursei de date de la național la urban) a produs această modificare a rezultatelor sau poliția noastră orașului este părtinitoare exact în același mod ca media națională și vedem doar o variație aleatorie? Valoarea p ne va ajuta să determinăm acest lucru.

3. Determinați numărul de grade de libertate ale experimentului dvs

Numărul de grade de libertate este gradul de variabilitate din experimentul dvs., care este determinat de numărul de categorii pe care le explorați. Ecuația pentru numărul de grade de libertate este Numărul de grade de libertate = n-1, unde „n” este numărul de categorii sau variabile pe care le analizați în experiment.

Exemplu: în experimentul nostru, există două categorii de rezultate: o categorie pentru mașini roșii și una pentru mașini albastre. Prin urmare, în experimentul nostru, avem 2-1 = 1 grad de libertate. Dacă am compara mașini roșii, albastre și verzi, am avea 2 grade de libertate și așa mai departe.

4. Comparați rezultatele așteptate și observate folosind testul chi-pătrat

Chi-pătratul (scris „x2”) este o valoare numerică care măsoară diferența dintre valorile așteptate și cele observate ale unui experiment. Ecuația pentru chi-pătrat este x2 = Σ((o-e)2/e) unde „o” este valoarea observată și „e” este valoarea așteptată. Însumați rezultatele ecuației date pentru toate rezultatele posibile (vezi mai jos).

Rețineți că această ecuație include operatorul de însumare Σ (sigma). Cu alte cuvinte, trebuie să calculați ((|o-e|-.05)2/e) pentru fiecare rezultat posibil și să adăugați numerele împreună pentru a obține valoarea chi-pătrat. În exemplul nostru, avem două rezultate posibile - fie mașina care a primit penalizarea este roșie, fie albastră. Deci trebuie să numărăm ((o-e)2/e) de două ori - o dată pentru mașinile roșii și o dată pentru mașinile albastre.

Exemplu: Să introducem valorile noastre așteptate și observate în ecuația x2 = Σ((o-e)2/e). Amintiți-vă că, din cauza operatorului de însumare, trebuie să numărăm ((o-e)2/e) de două ori - o dată pentru mașinile roșii și o dată pentru mașinile albastre. Vom face acest lucru după cum urmează:
x2 = ((90-100)2/100) + (60-50)2/50)
x2 = ((-10)2/100) + (10)2/50)
x2 = (100/100) + (100/50) = 1 + 2 = 3.

5. Alegeți un nivel de semnificație

Acum că știm numărul de grade de libertate din experimentul nostru și știm valoarea testului chi-pătrat, trebuie să facem încă un lucru înainte de a ne putea găsi valoarea p. Trebuie să stabilim nivelul de semnificație. vorbind limbaj simplu, nivelul de semnificație indică cât de încrezători suntem în rezultatele noastre. O valoare scăzută a semnificației corespunde unei probabilități scăzute ca rezultatele experimentale să fie obținute întâmplător și invers. Nivelurile de semnificație sunt scrise ca fracții zecimale (cum ar fi 0,01), ceea ce corespunde probabilității ca rezultatele experimentale să fie obținute întâmplător (în acest caz, probabilitatea acestui lucru este de 1%).

Prin convenție, oamenii de știință stabilesc de obicei nivelul de semnificație al experimentelor lor la 0,05 sau 5%. Aceasta înseamnă că rezultatele experimentale care îndeplinesc un astfel de criteriu de semnificație ar putea fi obținute doar cu o probabilitate de 5% pur întâmplător. Cu alte cuvinte, există o șansă de 95% ca rezultatele să fie cauzate de modul în care omul de știință a manipulat variabilele experimentale, și nu întâmplător. Pentru majoritatea experimentelor, încrederea de 95% că există o relație între două variabile este suficientă pentru a considera că acestea sunt „cu adevărat” legate între ele.

Exemplu: pentru exemplul nostru cu mașini roșii și albastre, să urmăm convenția dintre oamenii de știință și să setăm nivelul de semnificație la 0,05.

6. Folosiți o foaie de date de distribuție chi-pătrat pentru a găsi valoarea p

Oamenii de știință și statisticienii folosesc foi de calcul mari pentru a calcula valoarea p a experimentelor lor. Datele din tabel au de obicei o axă verticală în stânga, corespunzătoare numărului de grade de libertate, și o axă orizontală în partea de sus, corespunzătoare valorii p. Utilizați datele din tabel pentru a găsi mai întâi numărul dvs. de grade de libertate, apoi uitați-vă la seria de la stânga la dreapta până când găsiți prima valoare mai mare decât valoarea chi-pătratului. Priviți valoarea p corespunzătoare din partea de sus a coloanei dvs. Valoarea ta p este între acest număr și următorul (cel din stânga al tău).

Tabelele de distribuție chi-pătrat pot fi obținute din mai multe surse (aici puteți găsi unul la acest link).

Exemplu: Valoarea noastră chi-pătrat a fost 3. Deoarece știm că există doar 1 grad de libertate în experimentul nostru, vom selecta primul rând. Mergem de la stânga la dreapta de-a lungul acestei linii până când întâlnim o valoare mai mare de 3, valoarea noastră de test chi-pătrat. Primul pe care îl găsim este 3,84. Privind coloana noastră, vedem că valoarea p corespunzătoare este 0,05. Aceasta înseamnă că valoarea noastră p este între 0,05 și 0,1 (cea mai mare valoare p din tabel).

7. Decide dacă să respingi sau să-ți păstrezi ipoteza nulă

Deoarece ați determinat valoarea p aproximativă pentru experimentul dvs., trebuie să decideți dacă respingeți sau nu ipoteza nulă a experimentului (rețineți, aceasta este ipoteza că variabilele experimentale pe care le-ați manipulat nu au afectat rezultatele pe care le-ați observat). Dacă valoarea p este mai mică decât nivelul de semnificație, felicitări, ați dovedit că există o relație foarte probabilă între variabilele pe care le-ați manipulat și rezultatele pe care le-ați observat. Dacă valoarea p este mai mare decât nivelul de semnificație, nu puteți fi sigur dacă rezultatele pe care le-ați observat s-au datorat purului hazard sau manipulării variabilelor dvs.

Exemplu: valoarea noastră p este între 0,05 și 0,1. Acesta este în mod clar nu mai puțin de 0,05, așa că, din păcate, nu putem respinge ipoteza noastră nulă. Asta înseamnă că nu am atins o probabilitate de minim 95% să spunem că poliția din orașul nostru emite bilete pentru mașinile roșii și albastre cu o probabilitate destul de diferită de media națională.

Cu alte cuvinte, există 5-10% șanse ca rezultatele pe care le observăm să nu fie consecințele unei schimbări de locație (analiza orașului, nu a întregii țări), ci pur și simplu un accident. Întrucât am cerut o precizie mai mică de 5%, nu putem spune că suntem siguri că poliția din orașul nostru este mai puțin părtinitoare față de mașinile roșii - există o șansă mică (dar semnificativă statistic) ca acesta să nu fie cazul.

În tabelele rezultatelor calculelor statistice în lucrări de curs, teze de diplomă și de master în psihologie, există întotdeauna un indicator „p”.

De exemplu, în conformitate cu obiectivele cercetării Au fost calculate diferențe în nivelul de semnificație al vieții la băieți și fete din adolescență.

	Rău		Testul U Mann-Whitney	Nivel de semnificație statistică (p)
	Băieți (20 persoane)	Fetelor (5 oameni)	Testul U Mann-Whitney	Nivel de semnificație statistică (p)
Goluri	28,9	35,2	17,5	0,027*
Proces	30,1	32,0	38,5	0,435
Rezultat	25,2	29,0	29,5	0,164
Locus de control - „Eu”	20,3	23,6		0,067
Locus of Control - „Viața”	30,4	33,8	27,5	0,126
Semnificația vieții	98,9	111,2		0,103

* - diferențele sunt semnificative statistic (p≤ 0,05)

Coloana din dreapta indică valoarea lui „p” și prin valoarea sa se poate determina dacă diferențele de semnificație a vieții în viitor la băieți și fete sunt semnificative sau nu. Regula este simplă:

Dacă nivelul de semnificație statistică „p” este mai mic sau egal cu 0,05, atunci concluzionăm că diferențele sunt semnificative. În tabelul de mai sus, diferențele dintre băieți și fete sunt semnificative în raport cu indicatorul „Obiective” - semnificația vieții în viitor. La fete, acest indicator este statistic semnificativ mai mare decât la băieți.
Dacă nivelul de semnificație statistică „p” este mai mare de 0,05, atunci se ajunge la concluzia că diferențele nu sunt semnificative. În tabelul de mai sus, diferențele dintre băieți și fete nu sunt semnificative pentru toți ceilalți indicatori, cu excepția primului.

De unde provine nivelul de semnificație statistică „p”.

Se calculează nivelul de semnificație statistică program statisticîmpreună cu calculul criteriului statistic. În aceste programe, puteți seta și o limită critică pentru nivelul de semnificație statistică, iar indicatorii corespunzători vor fi evidențiați de program.

De exemplu, în programul STATISTICA, la calcularea corelațiilor, puteți seta limita p, de exemplu, 0,05, iar toate relațiile semnificative statistic vor fi evidențiate cu roșu.

Dacă calculul criteriului statistic este efectuat manual, atunci nivelul de semnificație „p” este determinat prin compararea valorii criteriului obținut cu valoarea critică.

Ce arată nivelul de semnificație statistică „p”.

Toate calculele statistice sunt aproximative. Nivelul acestei aproximări determină „r”. Nivelul de semnificație este scris ca zecimale, de exemplu, 0,023 sau 0,965. Dacă înmulțim acest număr cu 100, obținem indicatorul p ca procent: 2,3% și 96,5%. Aceste procente reflectă probabilitatea ca presupunerea noastră a unei relații, de exemplu, între agresivitate și anxietate, să fie greșită.

Acesta este, coeficient de corelație 0,58 între agresivitate și anxietate se obține la un nivel de semnificație statistică de 0,05 sau o probabilitate de eroare de 5%. Ce înseamnă mai exact asta?

Corelația pe care am găsit-o înseamnă că în eșantionul nostru se observă următorul model: cu cât agresivitatea este mai mare, cu atât anxietatea este mai mare. Adică dacă luăm doi adolescenți, iar unul dintre ei va avea o anxietate mai mare decât celălalt, atunci, știind de corelația pozitivă, putem spune că acest adolescent va avea și o agresivitate mai mare. Dar din moment ce totul este aproximativ în statistică, atunci, afirmând acest lucru, admitem că putem greși, iar probabilitatea unei erori este de 5%. Adică, făcând 20 de astfel de comparații în acest grup de adolescenți, putem greși cu prognoza despre nivelul de agresivitate o dată, cunoscând anxietatea.

Ce nivel de semnificație statistică este mai bun: 0,01 sau 0,05

Nivelul de semnificație statistică reflectă probabilitatea de eroare. Prin urmare, rezultatul la p=0,01 este mai precis decât la p=0,05.

În cercetarea psihologică, sunt acceptate două niveluri acceptabile de semnificație statistică a rezultatelor:

p=0,01 - fiabilitatea ridicată a rezultatului analiza comparativa sau analiza relațiilor;

p=0,05 - precizie suficientă.

Sper că acest articol vă va ajuta să scrieți o lucrare de psihologie pe cont propriu. Dacă aveți nevoie de ajutor, vă rugăm să contactați (toate tipurile de muncă în psihologie; calcule statistice).