Kako izračunati razinu statističke značajnosti. Objasnite što je to razina statističke značajnosti

Parametri distribucije uzorka određeni nizom mjerenja su slučajne varijable, stoga će i njihova odstupanja od općih parametara biti slučajna. Procjena ovih odstupanja je probabilističke prirode - u statističkoj analizi može se samo naznačiti vjerojatnost pojedine pogreške.

Neka za opći parametar a izvedeno iz iskustva nepristrana procjena a*. Dodijelimo dovoljno veliku vjerojatnost b (takvu da se događaj s vjerojatnošću b može smatrati praktički izvjesnim) i pronađemo takvu vrijednost e b = f(b) za koje

Raspon praktično mogućih vrijednosti pogreške koja se javlja prilikom zamjene a na a* , bit će ±e b . Pogreške koje su velike u apsolutnoj vrijednosti pojavit će se samo s malom vjerojatnošću.

nazvao razina značajnosti. Inače, izraz (4.1) se može tumačiti kao vjerojatnost da je prava vrijednost parametra a leži unutar

. (4.3)

Vjerojatnost b se naziva razina povjerenja te karakterizira pouzdanost dobivene procjene. Interval ja b= a* ± e b zove se interval pouzdanosti. Granice intervala a¢ = a* - e b i a¢¢ = a* + e b nazivaju se granice povjerenja. Interval pouzdanosti na danoj razini pouzdanosti određuje točnost procjene. Vrijednost intervala pouzdanosti ovisi o razini pouzdanosti s kojom je parametar zajamčeno pronađen a unutar intervala pouzdanosti: što je veća vrijednost b, veći je interval ja b (i vrijednost e b). Povećanje broja pokusa očituje se u smanjenju intervala pouzdanosti uz konstantnu vjerojatnost pouzdanosti ili u povećanju vjerojatnosti pouzdanosti uz zadržavanje intervala pouzdanosti.

U praksi se obično fiksira vrijednost vjerojatnosti pouzdanosti (0,9; 0,95 ili 0,99), a zatim se odredi interval pouzdanosti rezultata ja b. Prilikom konstruiranja intervala povjerenja rješava se problem apsolutnog odstupanja:

Dakle, ako je poznat zakon distribucije procjene a* , zadatak određivanja intervala pouzdanosti riješio bi se jednostavno. Razmotrimo konstrukciju intervala pouzdanosti za matematičko očekivanje normalno raspodijeljene slučajne varijable x s poznatim općim standardom s preko veličine uzorka n. Najbolji okvir za očekivanja m je srednja vrijednost uzorka sa standardnom devijacijom srednje vrijednosti

.

Pomoću Laplaceove funkcije dobivamo

. (4.5)

S obzirom na vjerojatnost pouzdanosti b, vrijednost određujemo iz tablice Laplaceove funkcije (Prilog 1) . Tada interval pouzdanosti za matematičko očekivanje poprima oblik

. (4.7)

Iz (4.7) se može vidjeti da je smanjenje intervala pouzdanosti obrnuto proporcionalno kvadratnom korijenu broja eksperimenata.

Poznavanje opće varijance omogućuje nam procjenu matematičkog očekivanja čak i za jedno opažanje. Ako za normalno raspodijeljenu slučajnu varijablu x kao rezultat eksperimenta, vrijednost x 1 , tada interval pouzdanosti za matematičko očekivanje za odabrani b ima oblik

gdje U 1-str/2 - kvantil standardne normalne distribucije (Prilog 2).

Zakon raspodjele ocjena a* ovisi o zakonu raspodjele količine x a posebno na sam parametar a. Da bi se zaobišla ova poteškoća, u matematičkoj statistici koriste se dvije metode:

1) približan - na n³ 50 zamijenite nepoznate parametre u izrazu za e b njihovim procjenama, na primjer:

2) od slučajne varijable a* prijeđi na drugu slučajnu varijablu Q * čiji zakon distribucije ne ovisi o procijenjenom parametru a, ali ovisi samo o veličini uzorka. n te o vrsti zakona raspodjele količine x. Veličine ove vrste su najdetaljnije proučavane za normalnu distribuciju slučajnih varijabli. Simetrični kvantili obično se koriste kao granice pouzdanosti za Q¢ i Q¢¢

, (4.9)

ili uzimajući u obzir (4.2)

. (4.10)

4.2. Testiranje statističkih hipoteza, testovi značajnosti,

greške prve i druge vrste.

Pod, ispod statističke hipoteze shvaćene su neke pretpostavke o distribucijama opće populacije jedne ili druge slučajne varijable. Testiranje hipoteza podrazumijeva usporedbu nekih statističkih pokazatelja, kriteriji provjere (kriteriji značajnosti) izračunati iz uzorka, s njihovim vrijednostima određenim pod pretpostavkom da je dana hipoteza istinita. Kod testiranja hipoteza obično se testira neka hipoteza. H 0 u usporedbi s alternativnom hipotezom H 1 .

Kako bismo odlučili hoćemo li prihvatiti ili odbaciti hipotezu, navedena je razina značajnosti R. Najčešće korištene razine značajnosti su 0,10, 0,05 i 0,01. Prema ovoj vjerojatnosti, korištenjem hipoteze o distribuciji procjene Q * (kriterij značajnosti), kvantilne granice pouzdanosti nalaze se, u pravilu, simetrične Q str/2 i Q 1- str/2 . Q brojevi str/2 i Q 1- str/2 nazivaju se kritične vrijednosti hipoteze; Q vrijednosti *< Qstr/2 i Q * > Q 1- str/2 čine kritičnu


područje hipoteze (ili područje neprihvaćanja hipoteze) (slika 12).

Riža. 12. Kritično područje Riža. 13. Provjera statistike

hipoteze. hipoteze.

Ako Q 0 pronađen u uzorku pada između Q str/2 i Q 1- str/2 , tada hipoteza dopušta takvu vrijednost kao slučajnu i stoga nema razloga za njeno odbacivanje. Ako vrijednost Q 0 padne u kritično područje, onda je to prema ovoj hipotezi praktički nemoguće. Ali otkako se pojavila, sama hipoteza je odbačena.

Postoje dvije vrste pogrešaka koje se mogu napraviti prilikom testiranja hipoteza. Pogreška tipa I je li to odbacivanje hipoteze koja je zapravo istinita. Vjerojatnost takve pogreške nije veća od prihvaćene razine značajnosti. Greška tipa II je li to hipoteza je prihvaćena, ali je zapravo lažna. Vjerojatnost ove pogreške je to manja što je razina značajnosti veća, jer se time povećava broj odbačenih hipoteza. Ako je vjerojatnost pogreške druge vrste a, tada se poziva vrijednost (1 - a). snaga kriterija.

Na sl. 13 prikazuje dvije krivulje gustoće distribucije slučajne varijable Q, koje odgovaraju dvjema hipotezama H 0 i H jedan . Ako je vrijednost dobivena iskustvom Q > Q str, tada se hipoteza odbacuje. H 0 i hipoteza je prihvaćena H 1, i obrnuto, ako je Q< Qstr.

Područje ispod krivulje gustoće vjerojatnosti koje odgovara valjanosti hipoteze H 0 desno od Q vrijednosti str, jednaka je razini značajnosti R, tj. vjerojatnosti greške prve vrste. Područje ispod krivulje gustoće vjerojatnosti koje odgovara valjanosti hipoteze H 1 lijevo od Q str, jednaka je vjerojatnosti pogreške druge vrste a, a desno od Q str- snaga kriterija (1 - a). Dakle, što više R, to više (1 - a). Prilikom testiranja hipoteze nastoje od svih mogućih kriterija odabrati onaj koji na određenoj razini značajnosti ima manju vjerojatnost pogreške tipa II..

Obično se kao optimalna razina značajnosti pri testiranju hipoteza koristi str= 0,05, jer ako je hipoteza koja se testira prihvaćena s danom razinom značajnosti, tada hipotezu, naravno, treba prepoznati kao konzistentnu s eksperimentalnim podacima; s druge strane, korištenje ove razine značajnosti ne daje temelj za odbacivanje hipoteze.

Na primjer, pronađene su dvije vrijednosti i neki parametar uzorka, koji se mogu smatrati procjenama općih parametara a 1 i a 2. Pretpostavlja se da je razlika između i slučajna i da opći parametri a 1 i a 2 su međusobno jednaki, tj. a 1 = a 2. Ova hipoteza se zove ništavan, ili Nulta hipoteza. Da biste to testirali, morate saznati je li odstupanje između i značajno prema nultoj hipotezi. Da bismo to učinili, obično se istražuje slučajna varijabla D = – i provjerava je li njezina razlika od nule značajna. Ponekad je prikladnije uzeti u obzir vrijednost / uspoređujući je s jedinicom.

Odbacujući nultu hipotezu, prihvaćaju alternativnu, koja se dijeli na dvije: > i< . Если одно из этих равенств заведомо невозможно, то альтернативная гипотеза называется jednostrano, a za provjeru koristite jednostrano kriteriji značajnosti (za razliku od konvencionalnih, bilateralni). U ovom slučaju potrebno je razmotriti samo jednu od polovica kritičnog područja (slika 12).

Na primjer, R= 0,05 s dvostranim kriterijem, kritične vrijednosti Q 0,025 i Q 0,975 odgovaraju, tj. Q * koje su uzele vrijednosti Q * smatraju se značajnim (neslučajnim)< Q 0.025 и Q * >Q 0,975. Uz jednostrani kriterij, jedna od ovih nejednakosti je očito nemoguća (na primjer, Q *< Q 0.025) и значимыми будут лишь Q * >Q 0,975. Vjerojatnost posljednje nejednakosti je 0,025 i stoga će razina značajnosti biti 0,025. Dakle, ako se za jednostrani test značajnosti koriste isti kritični brojevi kao i za dvostrani, te će vrijednosti odgovarati polovici razine značajnosti.

Obično se za jednostrani test uzima ista razina značajnosti kao i za dvostrani test, jer u tim uvjetima oba testa daju istu pogrešku tipa I. Da bi se to postiglo, jednostrani test mora biti izveden iz dvostranog, koji odgovara dvostruko višoj razini značajnosti od one prihvaćene. Za održavanje razine značajnosti za jednostrani test R= 0,05, za obostrano je potrebno uzeti R= 0,10, što daje kritične vrijednosti Q 0,05 i Q 0,95. Od njih će za jednostrani test ostati, na primjer, Q 0,95. Razina značajnosti za jednostrani test je 0,05. Ista razina značajnosti za dvostrani test odgovara kritičnoj vrijednosti Q 0,975. Ali Q 0,95< Q 0.975 , значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода.

Razina značajnosti u statistici je važan pokazatelj koji odražava stupanj povjerenja u točnost, istinitost primljenih (predviđenih) podataka. Koncept se široko koristi u raznim područjima: od socioloških istraživanja do statističkog testiranja znanstvenih hipoteza.

Definicija

Razina statističke značajnosti (ili statistički značajan rezultat) pokazuje kolika je vjerojatnost slučajnog pojavljivanja proučavanih pokazatelja. Ukupna statistička značajnost fenomena izražava se p-vrijednošću (p-razina). U svakom eksperimentu ili promatranju postoji mogućnost da su dobiveni podaci nastali zbog pogrešaka uzorkovanja. To posebno vrijedi za sociologiju.

To jest, vrijednost je statistički značajna, čija je vjerojatnost slučajnog pojavljivanja izuzetno mala ili teži ekstremima. Ekstrem u ovom kontekstu je stupanj odstupanja statistike od nulte hipoteze (hipoteze koja se testira na dosljednost s dobivenim podacima uzorka). U znanstvenoj praksi razina značajnosti bira se prije prikupljanja podataka i u pravilu je njezin koeficijent 0,05 (5%). Za sustave gdje su točne vrijednosti kritične, to može biti 0,01 (1%) ili manje.

Pozadina

Koncept razine značajnosti uveo je britanski statističar i genetičar Ronald Fisher 1925. godine kada je razvijao tehniku ​​za testiranje statističkih hipoteza. Pri analizi bilo kojeg procesa postoji određena vjerojatnost određenih pojava. Poteškoće nastaju pri radu s malim (ili neočitim) postocima vjerojatnosti koji potpadaju pod koncept "pogreške mjerenja".

U radu sa statistikama koje nisu bile dovoljno specifične da bi se testirale, znanstvenici su se suočili s problemom nulte hipoteze koja “spriječava” operirati s malim vrijednostima. Fisher je za takve sustave predložio određivanje vjerojatnosti događaja na 5% (0,05) kao prikladnu graničnu vrijednost uzorka koja omogućuje odbacivanje nulte hipoteze u izračunima.

Uvođenje fiksnog koeficijenta

Godine 1933 Jerzy znanstvenici Neumann i Egon Pearson u svojim su radovima preporučili postavljanje određene razine značajnosti unaprijed (prije prikupljanja podataka). Primjeri korištenja ovih pravila jasno su vidljivi tijekom izbora. Pretpostavimo da postoje dva kandidata, od kojih je jedan vrlo popularan, a drugi nije dobro poznat. Očito je da će na izborima pobijediti prvi kandidat, a šanse drugoga teže nuli. Težite – ali ne jednako: uvijek postoji mogućnost više sile, senzacionalnih informacija, neočekivanih odluka koje mogu promijeniti predviđene izborne rezultate.

Neumann i Pearson su se složili da je Fisherova predložena razina značajnosti od 0,05 (označena simbolom α) najprikladnija. Međutim, sam Fischer 1956. usprotivio se fiksiranju te vrijednosti. Smatrao je da se razina α treba postaviti u skladu s određenim okolnostima. Na primjer, u fizici čestica to je 0,01.

p-vrijednost

Pojam p-vrijednost prvi je upotrijebio Brownlee 1960. P-razina (p-vrijednost) je pokazatelj koji je obrnuto proporcionalan istinitosti rezultata. Najviša p-vrijednost odgovara najnižoj razini pouzdanosti u uzorkovani odnos između varijabli.

Ova vrijednost odražava vjerojatnost pogrešaka povezanih s tumačenjem rezultata. Pretpostavimo da je p-vrijednost = 0,05 (1/20). Pokazuje pet posto šanse da je odnos između varijabli pronađenih u uzorku samo slučajna značajka uzorka. Odnosno, ako te ovisnosti nema, onda se kod više sličnih eksperimenata, u prosjeku, u svakom dvadesetom istraživanju, može očekivati ​​ista ili veća ovisnost između varijabli. Često se p-razina smatra "marginom" razine pogreške.

Usput, p-vrijednost možda ne odražava stvarni odnos između varijabli, već samo pokazuje određenu prosječnu vrijednost unutar pretpostavki. Konkretno, konačna analiza podataka također će ovisiti o odabranim vrijednostima ovog koeficijenta. S p-razinom = 0,05 bit će nekih rezultata, a s koeficijentom jednakim 0,01, drugih.

Testiranje statističkih hipoteza

Razina statističke značajnosti posebno je važna kod testiranja hipoteza. Na primjer, kada se izračunava dvostrani test, područje odbijanja se jednako dijeli na oba kraja distribucije uzorkovanja (u odnosu na nultu koordinatu) i izračunava se istinitost dobivenih podataka.

Pretpostavimo da se prilikom praćenja određenog procesa (fenomena) pokazalo da novi statistički podaci pokazuju male promjene u odnosu na prethodne vrijednosti. Istodobno, odstupanja u rezultatima su mala, nisu očita, ali važna za studiju. Specijalist se suočava s dilemom: događaju li se promjene doista ili se radi o pogrešci uzorkovanja (netočnosti mjerenja)?

U tom slučaju se primjenjuje ili odbacuje nulta hipoteza (sve se otpisuje kao pogreška ili se promjena u sustavu prepoznaje kao svršen čin). Proces rješavanja problema temelji se na omjeru ukupne statističke značajnosti (p-vrijednosti) i razine značajnosti (α). Ako je p-razina< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Korištene vrijednosti

Razina značajnosti ovisi o analiziranom materijalu. U praksi se koriste sljedeće fiksne vrijednosti:

  • α = 0,1 (ili 10%);
  • α = 0,05 (ili 5%);
  • α = 0,01 (ili 1%);
  • α = 0,001 (ili 0,1%).

Što su točniji izračuni potrebni, manji se koristi koeficijent α. Naravno, statističke prognoze u fizici, kemiji, farmaciji i genetici zahtijevaju veću točnost nego u političkim znanostima i sociologiji.

Pragovi značajnosti u određenim područjima

U područjima visoke preciznosti kao što su fizika čestica i proizvodnja, statistička značajnost često se izražava kao omjer standardne devijacije (označene sigma - σ koeficijentom) u odnosu na normalnu distribuciju vjerojatnosti (Gaussovu distribuciju). σ je statistički pokazatelj koji određuje raspon vrijednosti određene veličine u odnosu na matematička očekivanja. Koristi se za iscrtavanje vjerojatnosti događaja.

Ovisno o području znanja, koeficijent σ jako varira. Na primjer, kada se predviđa postojanje Higgsovog bozona, parametar σ je jednak pet (σ=5), što odgovara p-vrijednosti=1/3,5 milijuna površina.

Učinkovitost

Mora se uzeti u obzir da koeficijenti α i p-vrijednost nisu egzaktne karakteristike. Bez obzira na razinu značajnosti u statistici fenomena koji se proučava, to nije bezuvjetna osnova za prihvaćanje hipoteze. Na primjer, što je manja vrijednost α, to je veća šansa da je postavljena hipoteza značajna. Međutim, postoji rizik od pogreške, što smanjuje statističku snagu (značajnost) studije.

Istraživači koji se fokusiraju isključivo na statistički značajne rezultate mogu izvući pogrešne zaključke. U isto vrijeme, teško je još jednom provjeriti njihov rad, budući da primjenjuju pretpostavke (koje su, zapravo, vrijednosti α i p-vrijednosti). Stoga se uvijek preporuča, uz izračun statističke značajnosti, odrediti još jedan pokazatelj - veličinu statističkog učinka. Veličina učinka je kvantitativna mjera snage učinka.

Vrijednost se zove Statistički značajno, ako je vjerojatnost čisto slučajnog pojavljivanja toga ili čak ekstremnijih vrijednosti mala. Ovdje je ekstrem stupanj odstupanja od nulte hipoteze. Za razliku se kaže da je "statistički značajna" ako postoje podaci za koje je malo vjerojatno da bi se pojavili ako se pretpostavi da razlika ne postoji; ovaj izraz ne znači da bi ta razlika trebala biti velika, važna ili značajna u općem smislu riječi.

Razina značajnosti testa tradicionalni je pojam testiranja hipoteza u statistici učestalosti. Definira se kao vjerojatnost odluke o odbacivanju nulte hipoteze ako je, zapravo, nulta hipoteza istinita (odluka je poznata kao pogreška tipa I ili lažno pozitivna odluka.) Proces odlučivanja često se oslanja na p-vrijednost (čitaj "pi-vrijednost"): ako je p-vrijednost manja od razine značajnosti, tada se nulta hipoteza odbacuje. Što je manja p-vrijednost, to se kaže da je statistički podatak testa značajniji. Što je p-vrijednost manja, to je jači razlog za odbacivanje nulte hipoteze.

Razina značajnosti obično se označava grčkim slovom α (alfa). Popularne razine značajnosti su 5%, 1% i 0,1%. Ako test daje p-vrijednost manju od α-razine, tada se nulta hipoteza odbacuje. Takvi se rezultati neformalno nazivaju "statistički značajni". Na primjer, ako netko kaže da su "šanse da je ono što se dogodilo slučajnost jednake jedan prema tisuću", tada misli na razinu značajnosti od 0,1%.

Različite vrijednosti α-razine imaju svoje prednosti i nedostatke. Manje α-razine daju više povjerenja da je alternativna hipoteza koja je već uspostavljena značajna, ali postoji veći rizik da se lažna nulta hipoteza ne odbaci (pogreška tipa II ili "lažno negativna odluka"), a time i manja statistička snaga. Odabir α-razine neizbježno zahtijeva kompromis između značaja i snage, a time i između vjerojatnosti pogreške tipa I i tipa II. U domaćem znanstvenih radovačesto se umjesto pojma "statistička značajnost" koristi netočan izraz "značajnost".

vidi također

Bilješke

George Casella, Roger L. Berger Testiranje hipoteza // Statistical Inference . -Drugo izdanje. - Pacific Grove, CA: Duxbury, 2002. - S. 397. - 660 str. - ISBN 0-534-24312-6


Zaklada Wikimedia. 2010. godine.

Pogledajte što je "razina značaja" u drugim rječnicima:

    Broj je toliko malen da se može smatrati gotovo sigurnim da se događaj s vjerojatnošću α neće dogoditi u jednom eksperimentu. Obično U. z. utvrđuje se proizvoljno, i to: 0,05, 0,01, a s posebnom točnošću 0,005 itd. U geol. raditi…… Geološka enciklopedija

    razina značajnosti- statistički kriterij (također se naziva "alfa razina" i označava se grčkim slovom) je gornja granica vjerojatnosti pogreške tipa I (vjerojatnost odbacivanja nulte hipoteze kada je ona zapravo istinita). Tipične vrijednosti su... Rječnik sociološke statistike

    Engleski razina, značaj; njemački Signifikanzniveau. Stupanj rizika je da istraživač može izvući krivi zaključak o pogrešnosti dodataka, hipoteza temeljenih na uzorku podataka. Antinazi. Enciklopedija sociologije, 2009 ... Enciklopedija sociologije

    razina značajnosti- - [L.G. Sumenko. Englesko-ruski rječnik informacijskih tehnologija. M .: GP TsNIIS, 2003.] Teme informacijske tehnologije općenito EN razina značaja ... Tehnički prevoditeljski priručnik

    razina značajnosti- 3.31 razina značajnosti α: dana vrijednost koja predstavlja gornju granicu vjerojatnosti odbacivanja statističke hipoteze kada je ta hipoteza istinita. Izvor: GOST R ISO 12491 2011: Građevinski materijali i proizvodi. ... ... Rječnik-priručnik pojmova normativne i tehničke dokumentacije

    RAZINA ZNAČAJA- koncept matematičke statistike, koji odražava stupanj vjerojatnosti pogrešnog zaključka u vezi sa statističkom hipotezom o distribuciji obilježja, provjerenom na temelju podataka uzorka. U psihološkim istraživanjima za dovoljnu razinu ... ... Moderno obrazovni proces: osnovni pojmovi i pojmovi

    razina značajnosti- reikšmingumo lygis statusas T sritis automatika atitikmenys: engl. razina značaja vok. Signifikanzniveau, n rus. razina značajnosti, m pranc. niveau de signifiance, m … Automatikos terminų žodynas

    razina značajnosti- reikšmingumo lygis statusas T sritis fizika atitikmenys: engl. razina značaja; razina značaja vok. Sicherheitsschwelle, f rus. razina značajnosti, fpranc. niveau de significance, m … Fizikos terminų žodynas

    Statistički test, pogledajte Razinu značajnosti... Velika sovjetska enciklopedija

    RAZINA ZNAČAJA- Vidi značaj, razinu... Rječnik u psihologiji

knjige

  • "Strogo čuvana tajna" . Lubjanka - Staljinu o stanju u zemlji (1922.-1934.). Svezak 4. Dio 1,. Višetomna temeljna publikacija radova - pregledi informacija i sažeci OGPU - jedinstven je po svom znanstvenom značaju, vrijednosti, sadržaju i opsegu. U ovom povijesnom…
  • Obrazovni program kao alat sustava upravljanja kvalitetom profesionalnog obrazovanja, Tkacheva Galina Viktorovna, Logachev Maxim Sergeevich, Samarin Yury Nikolaevich. Monografija analizira postojeće prakse oblikovanja sadržaja stručnih obrazovnih programa. Određuje se mjesto, struktura, sadržaj i razina značaja ...

p-vrijednost(eng.) - vrijednost koja se koristi pri testiranju statističkih hipoteza. Zapravo, to je vjerojatnost pogreške kod odbacivanja nulte hipoteze (pogreška prve vrste). Testiranje hipoteze pomoću P-vrijednosti je alternativa klasičnom postupku testiranja kroz kritičnu vrijednost distribucije.

Obično je P-vrijednost jednaka vjerojatnosti da će slučajna varijabla s danom distribucijom (distribucija testne statistike pod nultom hipotezom) poprimiti vrijednost koja nije manja od stvarne vrijednosti testne statistike. Wikipedia.

Drugim riječima, p-vrijednost je najmanja razina značajnosti (tj. vjerojatnost odbacivanja istinite hipoteze) za koju izračunata testna statistika dovodi do odbacivanja nulte hipoteze. Obično se p-vrijednost uspoređuje s općeprihvaćenim standardnim razinama značajnosti od 0,005 ili 0,01.

Na primjer, ako vrijednost testne statistike izračunate iz uzorka odgovara p = 0,005, to ukazuje na 0,5% vjerojatnosti da je hipoteza točna. Dakle, što je manja p-vrijednost, to bolje, jer povećava "snagu" odbacivanja nulte hipoteze i povećava očekivanu značajnost rezultata.

Zanimljivo objašnjenje toga nalazi se na Habréu.

Statistička analiza počinje nalikovati crnoj kutiji: ulaz su podaci, izlaz je tablica glavnih rezultata i p-vrijednost.

Što kaže p-vrijednost?

Pretpostavimo da smo odlučili saznati postoji li veza između ovisnosti o krvavim računalnim igrama i agresivnosti u stvarnom životu. Za to su nasumično formirane dvije grupe školaraca, svaka od 100 ljudi (1 grupa - ljubitelji pucačkih igara, druga grupa - ne igranje računalnih igrica). Na primjer, broj tučnjava s vršnjacima djeluje kao pokazatelj agresivnosti. U našem zamišljenom istraživanju pokazalo se da se skupina školaraca-kockara osjetno češće sukobljavala sa svojim drugovima. Ali kako saznati koliko su rezultirajuće razlike statistički značajne? Možda smo uočenu razliku dobili sasvim slučajno? Za odgovor na ova pitanja koristi se p-vrijednost - to je vjerojatnost dobivanja takvih ili izraženijih razlika, pod uvjetom da zapravo nema razlika u općoj populaciji. Drugim riječima, to je vjerojatnost da dobijemo takve ili čak jače razlike među našim grupama, pod uvjetom da računalne igrice zapravo ni na koji način ne utječu na agresivnost. Ne zvuči tako teško. Međutim, ova se statistika često krivo tumači.

primjeri p-vrijednosti

Dakle, usporedili smo dvije skupine školaraca međusobno u smislu razine agresivnosti koristeći standardni t-test (ili neparametarski Chi test - kvadrat prikladniji u ovoj situaciji) i otkrili da željeni p- razina značajnosti je manja od 0,05 (na primjer, 0,04). Ali što nam rezultirajuća vrijednost p-značajnosti zapravo govori? Dakle, ako je p-vrijednost vjerojatnost dobivanja takvih ili izraženijih razlika, pod uvjetom da zapravo nema razlika u općoj populaciji, što mislite koja je onda ispravna izjava:

1. Računalne igrice uzrok su agresivnog ponašanja s 96% vjerojatnosti.
2. Vjerojatnost da agresivnost i računalne igre nisu povezane je 0,04.
3. Ako bismo dobili p-razinu značajnosti veću od 0,05, to bi značilo da agresivnost i računalne igre nisu ni u kakvoj vezi.
4. Vjerojatnost slučajnog dobivanja takvih razlika je 0,04.
5. Sve izjave su pogrešne.

Ako ste odabrali petu opciju, onda ste potpuno u pravu! No, kako pokazuju brojne studije, čak i ljudi sa značajnim iskustvom u analizi podataka često pogrešno tumače p-vrijednosti.

Uzmimo svaki odgovor redom:

Prva izjava je primjer pogreške korelacije: činjenica da su dvije varijable značajno povezane ne govori nam ništa o uzroku i posljedici. Možda su agresivniji ljudi ti koji radije provode vrijeme igrajući računalne igrice, a nisu računalne igrice te koje ljude čine agresivnijima.

Ovo je zanimljivija izjava. Stvar je u tome što u početku uzimamo zdravo za gotovo da razlike zapravo i nema. I imajući ovo na umu kao činjenicu, izračunavamo p-vrijednost. Stoga je točna interpretacija: "Pod pretpostavkom da agresivnost i računalne igrice nisu ni na koji način povezane, tada je vjerojatnost dobivanja takvih ili još izraženijih razlika bila 0,04."

Ali što ako imamo beznačajne razlike? Znači li to da ne postoji povezanost između proučavanih varijabli? Ne, to samo znači da možda postoje razlike, ali naši rezultati nisu nam omogućili da ih otkrijemo.

Ovo je izravno povezano sa definicijom same p-vrijednosti. 0,04 je vjerojatnost dobivanja ovih ili čak ekstremnijih razlika. U principu, nemoguće je procijeniti vjerojatnost dobivanja točno takvih razlika kao u našem eksperimentu!

Ovo su zamke koje se mogu sakriti u tumačenju takvog pokazatelja kao što je p-vrijednost. Stoga je vrlo važno razumjeti mehanizme koji stoje u osnovi metoda analize i izračuna glavnih statističkih pokazatelja.

Kako pronaći p-vrijednost?

1. Odredite očekivane rezultate svog eksperimenta

Obično, kada znanstvenici provode eksperiment, oni već imaju ideju o tome koje rezultate treba smatrati "normalnim" ili "tipičnim". To se može temeljiti na eksperimentalnim rezultatima prošlih eksperimenata, na pouzdanim skupovima podataka, na podacima iz znanstvene literature ili se znanstvenik može temeljiti na nekim drugim izvorima. Za svoj eksperiment definirajte očekivane rezultate i izrazite ih brojevima.

Primjer: Na primjer, ranije studije su pokazale da je u vašoj zemlji veća vjerojatnost da će crveni automobili dobiti kazne za prebrzu vožnju nego plavi automobili. Na primjer, prosječni rezultati pokazuju 2:1 sklonost crvenim automobilima u odnosu na plave. Želimo utvrditi ima li policija iste predrasude prema boji automobila u vašem gradu. Da bismo to učinili, analizirat ćemo kazne izdane za prebrzu vožnju. Ako uzmemo slučajni skup od 150 kazni za prebrzu vožnju izdanih crvenim ili plavim automobilima, očekivali bismo da će 100 kazni biti izdano crvenim automobilima i 50 plavim ako je policija u našem gradu tako pristrana prema boji automobila kao što je ova promatrana u cijeloj zemlji.

2. Odredite vidljive rezultate svog eksperimenta

Sada kada ste odredili očekivane rezultate, morate eksperimentirati i pronaći stvarne (ili "promatrane") vrijednosti. Ove rezultate ponovno trebate predstaviti brojevima. Ako stvorimo eksperimentalne uvjete, a opaženi rezultati se razlikuju od očekivanih, onda imamo dvije mogućnosti - ili se to dogodilo slučajno, ili je to uzrokovano upravo našim eksperimentom. Svrha određivanja p-vrijednosti je upravo utvrditi razlikuju li se promatrani rezultati od očekivanih na takav način da se ne može odbaciti "nulta hipoteza" - hipoteza da ne postoji odnos između eksperimentalnih varijabli i promatranih rezultate.

Primjer: Na primjer, u našem gradu nasumično smo odabrali 150 kazni za prebrzu vožnju koje su izdane crvenim ili plavim automobilima. Utvrdili smo da je 90 kazni izdano crvenim automobilima, a 60 plavim. To se razlikuje od očekivanih rezultata, koji su 100, odnosno 50. Je li naš eksperiment (u ovom slučaju, promjena izvora podataka s nacionalnog na gradski) proizveo ovu promjenu u rezultatima ili je naša gradska policija pristrana na potpuno isti način kao i nacionalni prosjek, a mi vidimo samo slučajno odstupanje? P-vrijednost će nam pomoći da to odredimo.

3. Odredite broj stupnjeva slobode svog eksperimenta

Broj stupnjeva slobode je stupanj varijabilnosti u vašem eksperimentu, koji je određen brojem kategorija koje istražujete. Jednadžba za broj stupnjeva slobode je Broj stupnjeva slobode = n-1, gdje je "n" broj kategorija ili varijabli koje analizirate u svom eksperimentu.

Primjer: u našem eksperimentu postoje dvije kategorije rezultata: jedna kategorija za crvene automobile, a druga za plave automobile. Stoga, u našem eksperimentu, imamo 2-1 = 1 stupanj slobode. Kad bismo uspoređivali crvene, plave i zelene automobile, imali bismo 2 stupnja slobode itd.

4. Usporedite očekivane i opažene rezultate koristeći hi-kvadrat test

Hi-kvadrat (napisano "x2") je numerička vrijednost koja mjeri razliku između očekivanih i promatranih vrijednosti eksperimenta. Jednadžba za hi-kvadrat je x2 = Σ((o-e)2/e) gdje je "o" opažena vrijednost, a "e" očekivana vrijednost. Zbrojite rezultate dane jednadžbe za sve moguće ishode (vidi dolje).

Imajte na umu da ova jednadžba uključuje operator zbrajanja Σ (sigma). Drugim riječima, trebate izračunati ((|o-e|-.05)2/e) za svaki mogući ishod i zbrojiti brojeve kako biste dobili vrijednost hi-kvadrat. U našem primjeru imamo dva moguća ishoda - ili je automobil koji je dobio kaznu crven ili plav. Dakle, moramo brojati ((o-e)2/e) dva puta - jednom za crvene automobile, i jednom za plave automobile.

Primjer: Uključimo naše očekivane i promatrane vrijednosti u jednadžbu x2 = Σ((o-e)2/e). Upamtite da zbog operatora zbrajanja moramo dvaput brojati ((o-e)2/e) - jednom za crvene automobile i jednom za plave automobile. Ovo ćemo raditi na sljedeći način:
x2 = ((90-100)2/100) + (60-50)2/50)
x2 = ((-10)2/100) + (10)2/50)
x2 = (100/100) + (100/50) = 1 + 2 = 3.

5. Odaberite razinu značajnosti

Sada kada znamo broj stupnjeva slobode u našem eksperimentu i znamo vrijednost hi-kvadrat testa, moramo učiniti još jednu stvar prije nego što možemo pronaći našu p-vrijednost. Moramo odrediti razinu značaja. razgovarajući prostim jezikom, razina značajnosti pokazuje koliko smo sigurni u svoje rezultate. Niska vrijednost značajnosti odgovara maloj vjerojatnosti da su eksperimentalni rezultati dobiveni slučajno, i obrnuto. Razine značajnosti se pišu kao decimalni razlomci (kao što je 0,01), što odgovara vjerojatnosti da smo eksperimentalne rezultate dobili slučajno (u ovom slučaju, vjerojatnost da je to 1%).

Prema dogovoru, znanstvenici obično postavljaju razinu značajnosti svojih eksperimenata na 0,05 ili 5%. To znači da se eksperimentalni rezultati koji zadovoljavaju takav kriterij značajnosti mogu dobiti samo s vjerojatnošću od 5% čisto slučajno. Drugim riječima, postoji 95% šanse da su rezultati uzrokovani načinom na koji je znanstvenik manipulirao eksperimentalnim varijablama, a ne slučajnošću. Za većinu eksperimenata, 95% pouzdanosti da postoji odnos između dvije varijable dovoljno je da se smatra da su one "stvarno" povezane jedna s drugom.

Primjer: Za naš primjer s crvenim i plavim automobilima, slijedimo konvenciju između znanstvenika i postavimo razinu značajnosti na 0,05.

6. Upotrijebite podatkovnu tablicu distribucije chi-kvadrat da biste pronašli svoju p-vrijednost

Znanstvenici i statističari koriste velike proračunske tablice za izračunavanje p-vrijednosti svojih eksperimenata. Tablični podaci obično imaju okomitu os na lijevoj strani, koja odgovara broju stupnjeva slobode, i vodoravnu os na vrhu, koja odgovara p-vrijednosti. Upotrijebite podatke u tablici da biste prvo pronašli svoj broj stupnjeva slobode, a zatim pogledajte svoj niz slijeva nadesno dok ne pronađete prvu vrijednost veću od vaše vrijednosti hi-kvadrat. Pogledajte odgovarajuću p-vrijednost na vrhu svog stupca. Vaša p-vrijednost je između ovog broja i sljedećeg (onog lijevo od vašeg).

Tablice hi-kvadrat distribucije mogu se dobiti iz mnogih izvora (ovdje možete pronaći jednu na ovoj poveznici).

Primjer: Naša vrijednost hi-kvadrat bila je 3. Budući da znamo da u našem eksperimentu postoji samo 1 stupanj slobode, odabrat ćemo prvi redak. Idemo slijeva nadesno duž ove linije dok ne naiđemo na vrijednost veću od 3, našu vrijednost hi-kvadrat testa. Prvi koji nalazimo je 3,84. Gledajući naš stupac, vidimo da je odgovarajuća p-vrijednost 0,05. To znači da je naša p-vrijednost između 0,05 i 0,1 (sljedeća najveća p-vrijednost u tablici).

7. Odlučite hoćete li odbaciti ili zadržati svoju nultu hipotezu

Budući da ste odredili približnu p-vrijednost za svoj eksperiment, trebate odlučiti hoćete li odbaciti nultu hipotezu svog eksperimenta ili ne (podsjetimo se, ovo je hipoteza da eksperimentalne varijable kojima ste manipulirali nisu utjecale na rezultate koje ste promatrali). Ako je vaša p-vrijednost manja od vaše razine značajnosti, čestitamo, dokazali ste da postoji vrlo vjerojatan odnos između varijabli kojima ste manipulirali i rezultata koje ste promatrali. Ako je vaša p-vrijednost viša od vaše razine značajnosti, ne možete biti sigurni jesu li rezultati koje ste promatrali rezultat čiste slučajnosti ili manipulacije vašim varijablama.

Primjer: Naša p-vrijednost je između 0,05 i 0,1. Ovo očito nije manje od 0,05, tako da nažalost ne možemo odbaciti našu nultu hipotezu. To znači da nismo dosegli minimalnih 95% šanse da kažemo da policija u našem gradu izdaje kazne crvenim i plavim automobilima s vjerojatnošću koja je dosta drugačija od državnog prosjeka.

Drugim riječima, postoji 5-10% šanse da rezultati koje promatramo nisu posljedica promjene lokacije (analiza grada, ne cijele zemlje), već jednostavno nesreća. Budući da smo zahtijevali točnost manju od 5%, ne možemo reći da smo sigurni da je policija u našem gradu manje pristrana prema crvenim automobilima - postoji mala (ali statistički značajna) vjerojatnost da to nije slučaj.

U tablicama rezultata statističkih izračuna u seminarskim, diplomskim i magistarskim radovima iz psihologije uvijek postoji pokazatelj "p".

Na primjer, u skladu s ciljevi istraživanja Izračunate su razlike u stupnju smislenosti života kod dječaka i djevojčica adolescencije.

Zlobno

Mann-Whitney U test

Razina statističke značajnosti (p)

Dječaci (20 osoba)

Djevojke

(5 osoba)

Ciljevi

28,9

35,2

17,5

0,027*

Postupak

30,1

32,0

38,5

0,435

Proizlaziti

25,2

29,0

29,5

0,164

Lokus kontrole - "ja"

20,3

23,6

0,067

Mjesto kontrole - "Život"

30,4

33,8

27,5

0,126

Smisao života

98,9

111,2

0,103

* - razlike su statistički značajne (str0,05)

Desni stupac označava vrijednost "p" i po njegovoj vrijednosti se može utvrditi jesu li razlike u smislenosti života u budućnosti kod dječaka i djevojčica značajne ili neznačajne. Pravilo je jednostavno:

  • Ako je razina statističke značajnosti "p" manja ili jednaka 0,05, tada zaključujemo da su razlike značajne. U gornjoj tablici razlike između dječaka i djevojčica su značajne u odnosu na indikator „Ciljevi“ – ​​smislenost života u budućnosti. Kod djevojčica je ovaj pokazatelj statistički značajno viši nego kod dječaka.
  • Ako je razina statističke značajnosti "p" veća od 0,05, tada se zaključuje da razlike nisu značajne. U gornjoj tablici razlike između dječaka i djevojčica nisu značajne za sve ostale pokazatelje, osim za prvi.

Odakle dolazi razina statističke značajnosti "p".

Izračunava se razina statističke značajnosti statistički program zajedno s izračunom statističkog kriterija. U ovim programima također možete postaviti kritičnu granicu za razinu statističke značajnosti i program će istaknuti odgovarajuće indikatore.

Na primjer, u programu STATISTICA kod izračunavanja korelacija možete postaviti granicu p npr. 0,05 i svi statistički značajni odnosi bit će označeni crvenom bojom.

Ako se izračun statističkog kriterija provodi ručno, tada se razina značajnosti "p" određuje usporedbom vrijednosti dobivenog kriterija s kritičnom vrijednošću.

Što pokazuje razina statističke značajnosti "p".

Svi statistički izračuni su približni. Razina ove aproksimacije određuje "r". Razina značajnosti piše se kao decimalni brojevi, na primjer, 0,023 ili 0,965. Ako taj broj pomnožimo sa 100, dobivamo p pokazatelj u postocima: 2,3% i 96,5%. Ovi postoci odražavaju vjerojatnost da je naša pretpostavka o odnosu, na primjer, između agresivnosti i anksioznosti pogrešna.

To je, koeficijent korelacije 0,58 između agresivnosti i anksioznosti dobiva se na razini statističke značajnosti od 0,05 ili 5% vjerojatnosti pogreške. Što to točno znači?

Korelacija koju smo pronašli znači da se u našem uzorku uočava sljedeći obrazac: što je veća agresivnost, to je veća anksioznost. Odnosno, ako uzmemo dva tinejdžera, pa će jedan od njih imati veću anksioznost od drugog, onda, znajući za pozitivnu korelaciju, možemo reći da će taj tinejdžer imati i veću agresivnost. Ali budući da je u statistici sve približno, onda, navodeći ovo, priznajemo da možemo pogriješiti, a vjerojatnost pogreške je 5%. Odnosno, nakon što smo napravili 20 takvih usporedbi u ovoj skupini adolescenata, možemo jednom pogriješiti s prognozom o razini agresivnosti, poznavajući anksioznost.

Koja je razina statističke značajnosti bolja: 0,01 ili 0,05

Razina statističke značajnosti odražava vjerojatnost pogreške. Stoga je rezultat pri p=0,01 točniji nego pri p=0,05.

U psihološkim istraživanjima prihvaćene su dvije prihvatljive razine statističke značajnosti rezultata:

p=0,01 - visoka pouzdanost rezultata komparativna analiza ili analiza odnosa;

p=0,05 - dovoljna točnost.

Nadam se da će vam ovaj članak pomoći da sami napišete rad iz psihologije. Ukoliko trebate pomoć obratite se (sve vrste rada u psihologiji; statistički izračuni).