Kā aprēķināt statistiskās nozīmīguma līmeni. Paskaidrojiet, kāds ir statistiskās nozīmīguma līmenis.

No mērījumu sērijas noteiktie izlases sadalījuma parametri ir gadījuma lielumi, tāpēc arī to novirzes no vispārējiem parametriem būs nejaušas. Šo noviržu novērtējumam ir varbūtības raksturs – statistiskajā analīzē var norādīt tikai konkrētas kļūdas iespējamību.

Ļaujiet vispārīgajam parametram A objektīvs novērtējums, kas iegūts no pieredzes A*. Piešķirsim pietiekami lielu varbūtību b (tā, lai notikumu ar varbūtību b varētu uzskatīt par praktiski noteiktu) un atradīsim šādu vērtību e b = f(b), kam

Nomaiņas laikā radušās kļūdas praktiski iespējamo vērtību diapazons A ieslēgts A*, būs ±e b. Kļūdas, kuru absolūtā vērtība ir liela, parādīsies tikai ar mazu varbūtību

sauca nozīmes līmenis. Pretējā gadījumā izteiksmi (4.1) var interpretēt kā varbūtību, ka parametra patiesā vērtība A atrodas iekšā

. (4.3)

Tiek saukta varbūtība b ticamības varbūtība un raksturo iegūtās aplēses ticamību. Intervāls es b = a* ± e b sauc ticamības intervāls. Intervālu robežas a¢ = a* - e b un a¢¢ = a Tiek saukti * + e b uzticības robežas. Uzticamības intervāls noteiktā ticamības līmenī nosaka aplēses precizitāti. Ticamības intervāla vērtība ir atkarīga no ticamības varbūtības, ar kādu tiek garantēta parametra atrašana A ticamības intervāla iekšpusē: jo lielāka b vērtība, jo lielāks intervāls es b (un e b vērtība). Eksperimentu skaita pieaugums izpaužas kā ticamības intervāla samazināšanās ar nemainīgu ticamības varbūtību vai ticamības varbūtības palielināšanās, saglabājot ticamības intervālu.

Praksē ticamības varbūtības vērtība parasti tiek fiksēta (0,9, 0,95 vai 0,99) un pēc tam tiek noteikts rezultāta ticamības intervāls. es b. Konstruējot ticamības intervālu, tiek atrisināta absolūtās novirzes problēma:

Tātad, ja būtu zināms tāmes sadales likums A*, ticamības intervāla noteikšanas problēma tiktu atrisināta vienkārši. Apsvērsim iespēju izveidot ticamības intervālu normāli sadalīta gadījuma mainīgā matemātiskām cerībām X ar zināmu vispārīgu standartu s izlases izmēram n. Labākais aprēķins matemātiskām prognozēm m ir izlases vidējais lielums ar vidējās vērtības standartnovirzi

.

Izmantojot Laplasa funkciju, mēs iegūstam

. (4.5)

Ņemot vērā ticamības varbūtību b, no Laplasa funkcijas tabulas (1. pielikums) nosakām vērtību . Tad matemātiskās cerības ticamības intervāls iegūst formu

. (4.7)

No (4.7) ir skaidrs, ka ticamības intervāla samazināšanās ir apgriezti proporcionāla eksperimentu skaita kvadrātsaknei.

Zinot vispārējo dispersiju, var novērtēt matemātisko cerību pat no viena novērojuma. Ja normāli sadalītam gadījuma mainīgajam X eksperimenta rezultātā tika iegūta vērtība X 1, tad matemātiskās cerības ticamības intervālam izvēlētajam b ir forma

Kur U 1-lpp/2 - standarta normālā sadalījuma kvantile (2. pielikums).

Vērtēšanas sadalījuma likums A* atkarīgs no vērtības sadalījuma likuma X un jo īpaši no paša parametra A. Lai apietu šo grūtību, matemātiskajā statistikā tiek izmantotas divas metodes:

1) tuvu - plkst n³ 50 aizstāj nezināmus parametrus izteiksmē e b ar to aprēķiniem, piemēram:

2) no nejauša lieluma A* pārejiet uz citu gadījuma lielumu Q *, kura sadalījuma likums nav atkarīgs no aprēķinātā parametra A, bet ir atkarīgs tikai no izlases lieluma n un par daudzuma sadales likuma veidu X. Šie lielumu veidi ir visdetalizētāk pētīti nejaušo lielumu normālajam sadalījumam. Simetriskas kvantiles parasti izmanto kā ticamības robežas Q¢ un Q¢¢

, (4.9)

vai ņemot vērā (4.2.)

. (4.10)

4.2. Statistisko hipotēžu pārbaude, nozīmīguma kritēriji,

pirmā un otrā veida kļūdas.

Zem statistiskās hipotēzes ir saprotami daži pieņēmumi par konkrēta gadījuma lieluma populācijas sadalījumu. Hipotēžu pārbaude nozīmē noteiktu statistisko rādītāju salīdzināšanu, pārbaudes kritēriji (nozīmīguma kritēriji), kas aprēķināti no izlases, un to vērtības noteiktas, pieņemot, ka dotā hipotēze ir patiesa. Hipotēžu pārbaudē parasti tiek pārbaudīta hipotēze. N 0 pret alternatīvu hipotēzi N 1 .

Lai izlemtu, vai hipotēze tiek pieņemta vai noraidīta, tiek noteikts nozīmīguma līmenis R. Visbiežāk izmantotie nozīmīguma līmeņi ir 0,10, 0,05 un 0,01. Pamatojoties uz šo varbūtību, izmantojot hipotēzi par Q * novērtējuma sadalījumu (nozīmīguma kritēriju), tiek atrastas kvantiļu ticamības robežas, parasti simetriskas Q lpp/2 un Q 1- lpp/2. Q cipari lpp/2 un Q 1- lpp/2 tiek saukti hipotēzes kritiskās vērtības; Q vērtības*< Qlpp/2 un Q * > Q 1- lpp/2 forma kritiska


hipotēzes apgabals (vai hipotēzes nepieņemšanas laukums) (12. att.).

Rīsi. 12. Kritiskais reģions Rīsi. 13. Pārbauda statistiku

hipotēzes. hipotēzes.

Ja paraugā atrastais Q 0 ir starp Q lpp/2 un Q 1- lpp/2, tad hipotēze pieļauj tādu vērtību kā nejaušība un tāpēc nav pamata to noraidīt. Ja Q 0 vērtība iekrīt kritiskajā apgabalā, tad saskaņā ar šo hipotēzi tas praktiski nav iespējams. Bet, kopš tā parādījās, pati hipotēze tiek noraidīta.

Pārbaudot hipotēzes, var tikt pieļautas divu veidu kļūdas. Pirmā veida kļūda vai tas ir hipotēze, kas patiesībā ir patiesa, tiek noraidīta. Šādas kļūdas iespējamība nav lielāka par pieņemto nozīmīguma līmeni. Otrā veida kļūda vai tas ir hipotēze ir pieņemta, bet patiesībā tā ir nepareiza. Jo augstāks ir nozīmīguma līmenis, jo mazāka ir šīs kļūdas iespējamība, jo tas palielina noraidīto hipotēžu skaitu. Ja otrā tipa kļūdas iespējamība ir a, tad tiek izsaukta vērtība (1 - a). kritērija jauda.

Attēlā 13. attēlā parādītas divas nejaušā lieluma Q sadalījuma blīvuma līknes, kas atbilst divām hipotēzēm N 0 un N 1 . Ja no eksperimenta iegūst vērtību Q > Q lpp, tad hipotēze tiek noraidīta N 0 un hipotēze ir pieņemta N 1 un otrādi, ja Q< Qlpp.

Platība zem varbūtības blīvuma līknes, kas atbilst hipotēzes pamatotībai N 0 pa labi no Q vērtības lpp, vienāds ar nozīmīguma līmeni R, t.i., I tipa kļūdas iespējamība. Platība zem varbūtības blīvuma līknes, kas atbilst hipotēzes pamatotībai N 1 pa kreisi no Q lpp, ir vienāds ar otrā tipa kļūdas iespējamību a un pa labi no Q lpp- kritērija jauda (1 - a). Tādējādi, jo vairāk R, jo vairāk (1 - a). Pārbaudot hipotēzi, tiek mēģināts no visiem iespējamiem kritērijiem atlasīt to, kuram noteiktā nozīmīguma līmenī ir mazāka II tipa kļūdas iespējamība..

Parasti, pārbaudot hipotēzes, tiek izmantots optimālais nozīmīguma līmenis lpp= 0,05, jo, ja pārbaudāmā hipotēze tiek pieņemta ar noteiktu nozīmīguma līmeni, tad hipotēze noteikti jāuzskata par atbilstošu eksperimentālajiem datiem; no otras puses, šī nozīmīguma līmeņa izmantošana nedod pamatu hipotēzes noraidīšanai.

Piemēram, tiek atrastas divas kāda parauga parametra vērtības, kuras var uzskatīt par vispārējo parametru aplēsēm A 1 un A 2. Tiek izvirzīta hipotēze, ka atšķirība starp un ir nejauša un ka vispārīgie parametri A 1 un A 2 ir vienādi viens ar otru, t.i. A 1 = A 2. Šo hipotēzi sauc null, vai nulles hipotēze. Lai to pārbaudītu, ir jānoskaidro, vai neatbilstība starp nulles hipotēzi un tās nosacījumiem ir būtiska. Lai to izdarītu, viņi parasti pārbauda nejaušo lielumu D = – un pārbauda, ​​vai tā atšķirība no nulles ir nozīmīga. Dažreiz ir ērtāk apsvērt vērtību / salīdzinot to ar vienotību.

Noraidot nulles hipotēzi, mēs pieņemam alternatīvu, kas sadalās divās daļās: > un< . Если одно из этих равенств заведомо невозможно, то альтернативная гипотеза называется vienpusējs, un, lai to pārbaudītu, viņi izmanto vienpusējs nozīmīguma kritēriji (atšķirībā no parastajiem, divpusējs). Šajā gadījumā ir jāņem vērā tikai viena no kritiskā apgabala pusēm (12. att.).

Piemēram, R= 0,05 ar divpusēju kritēriju atbilst kritiskajām vērtībām Q 0,025 un Q 0,975, t.i., Q *, kas ņem vērtības Q *, tiek uzskatīti par nozīmīgiem (nejauši)< Q 0.025 и Q * >Q 0,975. Izmantojot vienpusēju kritēriju, viena no šīm nevienlīdzībām acīmredzami nav iespējama (piemēram, Q *< Q 0.025) и значимыми будут лишь Q * >Q 0,975. Pēdējās nevienādības varbūtība ir 0,025, un tāpēc nozīmīguma līmenis būs 0,025. Tādējādi, ja vienpusējai nozīmīguma pārbaudei tiek izmantoti tie paši kritiskie skaitļi, kas tiek izmantoti divpusējai pārbaudei, šīs vērtības atbildīs pusei no nozīmīguma līmeņa.

Parasti vienpusējai pārbaudei tiek pieņemts tāds pats nozīmīguma līmenis kā divpusējam testam, jo ​​šajos apstākļos abi testi nodrošina vienu un to pašu I tipa kļūdu. Lai to izdarītu, vienpusējs kritērijs ir jāatvasina no divpusējā kritērija, kas atbilst divreiz lielākam nozīmīguma līmenim nekā pieņemtais.. Saglabāt nozīmības līmeni vienpusīgam testam R= 0,05, abpusējai ir jāņem R= 0,10, kas dod kritiskās vērtības Q 0,05 un Q 0,95. No tiem vienpusējam kritērijam paliks viens, piemēram, Q 0,95. Vienpusēja testa nozīmīguma līmenis ir vienāds ar 0,05. Tāds pats nozīmīguma līmenis divpusējam testam atbilst kritiskajai vērtībai Q 0,975. Bet Q 0,95< Q 0.975 , значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода.

Nozīmīguma līmenis statistikā ir svarīgs rādītājs, kas atspoguļo pārliecības pakāpi iegūto (paredzamo) datu precizitātei un patiesumam. Jēdziens tiek plaši izmantots dažādās jomās: no socioloģisko pētījumu veikšanas līdz zinātnisku hipotēžu statistiskai pārbaudei.

Definīcija

Statistiskā nozīmīguma līmenis (jeb statistiski nozīmīgs rezultāts) parāda pētāmo rādītāju nejaušības rašanās varbūtību. Parādības kopējo statistisko nozīmīgumu izsaka ar p-vērtības koeficientu (p-līmenis). Jebkurā eksperimentā vai novērojumā pastāv iespēja, ka iegūtie dati radušies izlases kļūdu dēļ. Īpaši tas attiecas uz socioloģiju.

Tas nozīmē, ka statistiski nozīmīga vērtība ir vērtība, kuras nejaušības iespējamība ir ārkārtīgi maza vai tiecas uz galējību. Galējība šajā kontekstā ir pakāpe, kādā statistika novirzās no nulles hipotēzes (hipotēzes, kas tiek pārbaudīta, lai nodrošinātu atbilstību iegūtajiem izlases datiem). Zinātniskajā praksē nozīmīguma līmeni izvēlas pirms datu vākšanas, un parasti tā koeficients ir 0,05 (5%). Sistēmām, kurās precīzas vērtības ir ārkārtīgi svarīgas, šis skaitlis var būt 0,01 (1%) vai mazāks.

Fons

Nozīmīguma līmeņa jēdzienu ieviesa britu statistiķis un ģenētiķis Ronalds Fišers 1925. gadā, kad viņš izstrādāja statistisko hipotēžu pārbaudes paņēmienu. Analizējot jebkuru procesu, pastāv zināma noteiktu parādību iespējamība. Grūtības rodas, strādājot ar nelielu (vai ne acīmredzamu) varbūtību procentuālo daļu, kas atbilst jēdzienam “mērīšanas kļūda”.

Strādājot ar statistikas datiem, kas nav pietiekami specifiski, lai tos pārbaudītu, zinātnieki saskaras ar nulles hipotēzes problēmu, kas “neļauj” darboties ar maziem daudzumiem. Fišers ierosināja šādām sistēmām noteikt notikumu iespējamību pie 5% (0, 05) kā ērtu izlases griezumu, ļaujot aprēķinos noraidīt nulles hipotēzi.

Fiksēto koeficientu ieviešana

1933. gadā Jerzy zinātnieki Neimans un Egons Pīrsoni savos darbos ieteica jau iepriekš (pirms datu vākšanas) noteikt noteiktu nozīmīguma līmeni. Šo noteikumu izmantošanas piemēri ir skaidri redzami vēlēšanu laikā. Pieņemsim, ka ir divi kandidāti, no kuriem viens ir ļoti populārs, bet otrs ir maz zināms. Acīmredzami, ka pirmais kandidāts uzvarēs vēlēšanās, un otrā izredzes sliecas uz nulli. Viņi cenšas – bet nav vienlīdzīgi: vienmēr pastāv nepārvaramas varas iespēja, sensacionāla informācija, negaidīti lēmumi, kas var mainīt prognozētos vēlēšanu rezultātus.

Neimans un Pīrsons vienojās, ka Fišera nozīmīguma līmenis 0,05 (apzīmēts ar α) ir vispiemērotākais. Tomēr pats Fišers 1956. gadā iebilda pret šīs vērtības noteikšanu. Viņš uzskatīja, ka α līmenis ir jānosaka atbilstoši konkrētiem apstākļiem. Piemēram, daļiņu fizikā tas ir 0,01.

p līmeņa vērtība

Terminu p-vērtība pirmo reizi izmantoja Braunlijs 1960. gadā. P līmenis (p vērtība) ir rādītājs, kas ir apgriezti saistīts ar rezultātu patiesumu. Augstākais p-vērtības koeficients atbilst zemākajam ticamības līmenim izlases sakarībā starp mainīgajiem.

Šī vērtība atspoguļo kļūdu iespējamību, kas saistīta ar rezultātu interpretāciju. Pieņemsim, ka p-līmenis = 0,05 (1/20). Tas parāda piecu procentu varbūtību, ka attiecība starp izlasē atrastajiem mainīgajiem ir tikai izlases nejauša iezīme. Tas ir, ja šīs atkarības nav, tad ar atkārtotiem līdzīgiem eksperimentiem vidēji katrā divdesmitajā pētījumā var sagaidīt tādu pašu vai lielāku atkarību starp mainīgajiem. P-līmenis bieži tiek uzskatīts par kļūdu īpatsvara "robežu".

Starp citu, p-vērtība var neatspoguļot reālās attiecības starp mainīgajiem, bet parāda tikai noteiktu vidējo vērtību pieņēmumu ietvaros. Jo īpaši datu galīgā analīze būs atkarīga arī no šī koeficienta izvēlētajām vērtībām. Pie p līmeņa = 0,05 būs daži rezultāti, un pie koeficienta, kas vienāds ar 0,01, būs dažādi rezultāti.

Statistisko hipotēžu pārbaude

Pārbaudot hipotēzes, īpaši svarīgs ir statistiskās nozīmīguma līmenis. Piemēram, aprēķinot divpusēju testu, noraidīšanas apgabals tiek sadalīts vienādi abos izlases sadalījuma galos (attiecībā pret nulles koordinātu) un tiek aprēķināta iegūto datu patiesība.

Pieņemsim, ka, uzraugot noteiktu procesu (parādību), izrādījās, ka jaunā statistiskā informācija liecina par nelielām izmaiņām salīdzinājumā ar iepriekšējām vērtībām. Tajā pašā laikā rezultātu neatbilstības ir nelielas, nav acīmredzamas, bet svarīgas pētījumam. Speciālists saskaras ar dilemmu: vai tiešām notiek izmaiņas vai tās ir izlases kļūdas (mērījumu neprecizitāte)?

Šajā gadījumā viņi izmanto vai noraida nulles hipotēzi (visu attiecina uz kļūdu vai atzīst izmaiņas sistēmā kā fait accompli). Problēmu risināšanas process balstās uz kopējā statistiskā nozīmīguma (p-vērtība) un nozīmīguma līmeņa (α) attiecību. Ja p-līmenis< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Izmantotās vērtības

Nozīmīguma līmenis ir atkarīgs no analizējamā materiāla. Praksē tiek izmantotas šādas fiksētās vērtības:

  • α = 0,1 (vai 10%);
  • α = 0,05 (vai 5%);
  • α = 0,01 (vai 1%);
  • α = 0,001 (vai 0,1%).

Jo precīzāki aprēķini ir nepieciešami, jo mazāks tiek izmantots α koeficients. Protams, statistikas prognozēm fizikā, ķīmijā, farmācijā un ģenētikā ir nepieciešama lielāka precizitāte nekā politikas zinātnē un socioloģijā.

Nozīmīguma sliekšņi konkrētās jomās

Augstas precizitātes jomās, piemēram, daļiņu fizikā un ražošanā, statistisko nozīmīgumu bieži izsaka kā standartnovirzes attiecību (ko apzīmē ar sigmas koeficientu — σ) attiecībā pret normālu varbūtības sadalījumu (Gausa sadalījums). σ ir statistisks rādītājs, kas nosaka noteikta daudzuma vērtību izkliedi attiecībā pret matemātiskajām cerībām. Izmanto, lai attēlotu notikumu varbūtību.

Atkarībā no zināšanu jomas koeficients σ ļoti atšķiras. Piemēram, prognozējot Higsa bozona esamību, parametrs σ ir vienāds ar pieci (σ = 5), kas atbilst p-vērtībai = 1/3,5 milj.. Genoma pētījumos nozīmīguma līmenis var būt 5 × 10 - 8, kas šajās jomās nav nekas neparasts.

Efektivitāte

Jāņem vērā, ka koeficienti α un p-vērtība nav precīzi raksturlielumi. Lai kāds būtu pētāmās parādības statistikas nozīmīguma līmenis, tas nav beznosacījuma pamats hipotēzes pieņemšanai. Piemēram, jo ​​mazāka ir α vērtība, jo lielāka iespēja, ka izvirzītā hipotēze ir nozīmīga. Tomēr pastāv kļūdu risks, kas samazina pētījuma statistisko jaudu (nozīmību).

Pētnieki, kas koncentrējas tikai uz statistiski nozīmīgiem rezultātiem, var nonākt pie kļūdainiem secinājumiem. Tajā pašā laikā ir grūti vēlreiz pārbaudīt viņu darbu, jo viņi izmanto pieņēmumus (kas patiesībā ir α un p vērtības). Tāpēc vienmēr ir ieteicams līdztekus statistiskā nozīmīguma aprēķināšanai noteikt vēl vienu rādītāju – statistiskā efekta lielumu. Efekta lielums ir kvantitatīvs efekta stipruma mērs.

Daudzums tiek saukts statistiski nozīmīgi, ja tā vai pat ekstremālāku vērtību tīri nejaušas rašanās iespējamība ir zema. Šeit ekstrēms nozīmē novirzes pakāpi no nulles hipotēzes. Atšķirību uzskata par "statistiski nozīmīgu", ja ir pierādījumi, kas, visticamāk, nerastos, ja pieņemtu, ka atšķirības nepastāv; šis izteiciens nenozīmē, ka atšķirībai jābūt lielai, svarīgai vai nozīmīgai šī vārda vispārējā nozīmē.

Testa nozīmīguma līmenis ir tradicionālais hipotēžu pārbaudes jēdziens bieži sastopamajā statistikā. To definē kā varbūtību pieņemt lēmumu noraidīt nulles hipotēzi, ja patiesībā nulles hipotēze ir patiesa (lēmums, kas pazīstams kā I tipa kļūda, vai kļūdaini pozitīvs lēmums.) Lēmuma pieņemšanas process bieži balstās uz p-vērtību (izrunā " pi-vērtība"): ja p-vērtība ir mazāka par nozīmīguma līmeni, tad nulles hipotēze tiek noraidīta. Jo mazāka ir p vērtība, jo nozīmīgāka ir testa statistika. Jo mazāka ir p vērtība, jo spēcīgāks iemesls ir noraidīt nulles hipotēzi.

Nozīmīguma līmeni parasti apzīmē ar grieķu burtu α (alfa). Populārie nozīmīguma līmeņi ir 5%, 1% un 0,1%. Ja tests rada p vērtību, kas ir mazāka par α līmeni, tad nulles hipotēze tiek noraidīta. Šādus rezultātus neoficiāli sauc par “statistiski nozīmīgiem”. Piemēram, ja kāds saka, ka "izredzes, ka notikušais ir nejaušība, ir viens pret tūkstoti", tad viņi runā par 0,1% nozīmīguma līmeni.

Dažādām α līmeņa vērtībām ir savas priekšrocības un trūkumi. Mazāki α līmeņi nodrošina lielāku pārliecību, ka jau izveidotā alternatīvā hipotēze ir nozīmīga, taču pastāv lielāks risks, ka netiks noraidīta viltus nulles hipotēze (II tipa kļūda vai "viltus negatīvs lēmums"), un tādējādi ir mazāka statistiskā jauda. α līmeņa izvēle neizbēgami prasa kompromisu starp nozīmīgumu un jaudu, un līdz ar to starp I un II tipa kļūdu iespējamību. Sadzīvē zinātniskie darbi"statistiskā nozīmīguma" vietā bieži tiek lietots nepareizs termins "uzticamība".

Skatīt arī

Piezīmes

Džordžs Kasella, Rodžers L. Bergers Hipotēžu pārbaude // Statistiskais secinājums. - Otrais izdevums. - Pacific Grove, CA: Duxbury, 2002. - P. 397. - 660 lpp. - ISBN 0-534-24312-6


Wikimedia fonds. 2010. gads.

Skatiet, kas ir “Nozīmīguma līmenis” citās vārdnīcās:

    Skaitlis ir tik mazs, ka gandrīz droši var uzskatīt, ka notikums ar varbūtību α nenotiks vienā eksperimentā. Parasti U. z. fiksēts patvaļīgi, proti: 0,05, 0,01 un ar īpašu precizitāti 0,005 utt. Ģeol. darbojas...... Ģeoloģiskā enciklopēdija

    nozīmīguma līmenis- statistikas kritērijs (saukts arī par "alfa līmeni" un apzīmēts ar grieķu burtu) ir I tipa kļūdas varbūtības augšējā robeža (varbūtība noraidīt nulles hipotēzi, ja tā patiešām ir patiesa). Tipiskās vērtības ir... Socioloģiskās statistikas vārdnīca

    Angļu līmenis, nozīme; vācu Signifikanzniveau. Riska pakāpe ir tāda, ka, pamatojoties uz izlases datiem, pētnieks var izdarīt nepareizu secinājumu par statistiskās hipotēzes maldīgumu. Antinazi. Socioloģijas enciklopēdija, 2009... Socioloģijas enciklopēdija

    nozīmīguma līmenis- - [L.G.Sumenko. Angļu-krievu informācijas tehnoloģiju vārdnīca. M.: Valsts uzņēmums TsNIIS, 2003.] Tēmas informācijas tehnoloģijas kopumā EN nozīmes līmenis ... Tehniskā tulkotāja rokasgrāmata

    nozīmīguma līmenis- 3,31 nozīmīguma līmenis α: norādīta vērtība, kas atspoguļo statistiskās hipotēzes noraidīšanas varbūtības augšējo robežu, ja šī hipotēze ir patiesa. Avots: GOST R ISO 12491 2011: Būvmateriāli un izstrādājumi.… … Normatīvās un tehniskās dokumentācijas terminu vārdnīca-uzziņu grāmata

    NOZĪMĪBAS LĪMENIS- matemātiskās statistikas jēdziens, kas atspoguļo kļūdaina secinājuma varbūtības pakāpi attiecībā uz statistisko hipotēzi par raksturlieluma sadalījumu, kas pārbaudīta, pamatojoties uz izlases datiem. Psiholoģijas pētījumos pietiekamā līmenī...... Mūsdienīgs izglītības process: pamatjēdzieni un termini

    nozīmīguma līmenis- reikšmingo lygis statusas T joma automatika atitikmenys: engl. nozīmes līmenis vok. Signifikanzniveau, n rus. nozīmīguma līmenis, m pranc. niveau de signifiance, m … Automatikos terminų žodynas

    nozīmīguma līmenis- reikšmingo lygis statusas T joma fizika atitikmenys: engl. nozīmīguma līmenis; nozīmes līmenis vok. Sicherheitsschwelle, f rus. nozīmīguma līmenis, f pranc. niveau de significance, m … Fizikos terminų žodynas

    Statistiskais tests, skatiet sadaļu Nozīmīguma līmenis... Lielā padomju enciklopēdija

    NOZĪMĪBAS LĪMENIS- Skatiet nozīmi, līmeni... Vārdnīca psiholoģijā

Grāmatas

  • "Liels noslēpums" . Lubjanka - Staļinam par situāciju valstī (1922-1934). 4. sējums. 1. daļa,. Daudzsējumu fundamentāla dokumentu publikācija - informācijas apskati un ziņojumi par OGPU - ir unikāls ar savu zinātnisko nozīmi, vērtību, saturu un mērogu. Šajā vēsturiskajā...
  • Izglītības programma kā profesionālās izglītības kvalitātes vadības sistēmas instruments, Tkacheva Gaļina Viktorovna, Logachev Maxim Sergeevich, Samarin Jurijs Nikolajevičs. Monogrāfijā analizēta esošā prakse profesionālās izglītības programmu satura izstrādē. Vietu, struktūru, saturu un nozīmes līmeni nosaka...

P vērtība(angļu val.) - statistisko hipotēžu pārbaudē izmantotais daudzums. Faktiski tā ir kļūdas iespējamība, noraidot nulles hipotēzi (I tipa kļūda). Hipotēžu pārbaude, izmantojot P vērtību, ir alternatīva klasiskajai testēšanas procedūrai, izmantojot sadalījuma kritisko vērtību.

Parasti P vērtība ir vienāda ar varbūtību, ka nejaušam mainīgajam ar noteiktu sadalījumu (testa statistikas sadalījums saskaņā ar nulles hipotēzi) būs vērtība, kas nav mazāka par testa statistikas faktisko vērtību. Wikipedia.

Citiem vārdiem sakot, p-vērtība ir mazākais nozīmīguma līmenis (t.i., derīgas hipotēzes noraidīšanas varbūtība), kurai aprēķinātā testa statistika noved pie nulles hipotēzes noraidīšanas. Parasti p-vērtību salīdzina ar vispārpieņemtajiem standarta nozīmīguma līmeņiem 0,005 vai 0,01.

Piemēram, ja no izlases aprēķinātā testa statistika atbilst p = 0,005, tas norāda uz 0,5% varbūtību, ka hipotēze ir patiesa. Tādējādi, jo mazāka p vērtība, jo labāk, jo tas palielina nulles hipotēzes noraidīšanas “spēku” un palielina rezultāta sagaidāmo nozīmīgumu.

Habrē tam ir interesants skaidrojums.

Statistiskā analīze sāk atgādināt melno kasti: ievade ir dati, izvade ir galveno rezultātu tabula un p-vērtība.

Ko saka p-vērtība?

Pieņemsim, ka mēs nolēmām noskaidrot, vai pastāv saikne starp atkarību no asiņainām datorspēlēm un agresivitāti reālajā dzīvē. Šim nolūkam nejauši tika izveidotas divas skolēnu grupas pa 100 cilvēkiem katrā (1. grupa - šaušanas spēļu cienītāji, 2. grupa - tie, kas nespēlē datorspēles). Agresivitātes rādītājs ir, piemēram, kautiņu skaits ar vienaudžiem. Mūsu iedomātajā pētījumā atklājās, ka skolēnu grupa, kas ir azartspēļu atkarīgi, patiesībā manāmi biežāk konfliktē ar draugiem. Bet kā mēs varam noskaidrot, cik statistiski nozīmīgas ir atšķirības? Varbūt mēs pilnīgi nejauši ieguvām novēroto atšķirību? Lai atbildētu uz šiem jautājumiem, tiek izmantota nozīmīguma līmeņa p-vērtība (p-vērtība) - tā ir varbūtība iegūt šādas vai izteiktākas atšķirības, ar nosacījumu, ka vispārējā populācijā faktiski nav atšķirību. Citiem vārdiem sakot, tā ir iespēja iegūt tādas pašas vai pat spēcīgākas atšķirības starp mūsu grupām, ja faktiski datorspēles neietekmē agresivitāti. Neizklausās tik grūti. Tomēr šī konkrētā statistika ļoti bieži tiek nepareizi interpretēta.

Piemēri par p-vērtību

Tātad, mēs salīdzinājām divas skolēnu grupas savā starpā pēc to agresivitātes līmeņa, izmantojot standarta t-testu (vai neparametrisko Hī kvadrāta testu, kas šajā situācijā ir piemērotāks) un atklājām, ka kārotais p- nozīmīguma līmenis ir mazāks par 0,05 (piemēram, 0,04). Bet ko iegūtā p vērtība mums patiesībā stāsta? Tātad, ja p-vērtība ir iespēja iegūt šādas vai izteiktākas atšķirības, ar nosacījumu, ka populācijā faktiski nav atšķirību, tad kāds, jūsuprāt, ir pareizais apgalvojums:

1. Datorspēles ir agresīvas uzvedības cēlonis ar 96% varbūtību.
2. Varbūtība, ka agresija un datorspēles nav saistītas, ir 0,04.
3. Ja mēs saņemtu p nozīmīguma līmeni, kas ir lielāks par 0,05, tas nozīmētu, ka agresivitāte un datorspēles nekādā veidā nav saistītas viena ar otru.
4. Varbūtība nejauši iegūt šādas atšķirības ir 0,04.
5. Visi apgalvojumi ir nepareizi.

Ja izvēlējāties piekto variantu, tad jums ir pilnīga taisnība! Bet, kā liecina daudzi pētījumi, pat cilvēki ar ievērojamu pieredzi datu analīzē bieži nepareizi interpretē p-vērtību.

Apskatīsim visas atbildes secībā:

Pirmais apgalvojums ir korelācijas kļūdas piemērs: fakts, ka divi mainīgie ir būtiski korelēti, neko nepasaka par cēloni un sekām. Iespējams, ka agresīvāki cilvēki labprātāk pavada laiku spēlējot datorspēles, un nevis datorspēles padara cilvēkus agresīvākus.

Šis ir interesantāks apgalvojums. Lieta tāda, ka mēs sākotnēji uzskatām par pašsaprotamu, ka patiesībā nav nekādu atšķirību. Un, paturot to prātā kā faktu, mēs aprēķinām p-vērtību. Tāpēc pareizā interpretācija ir: "Ja pieņemam, ka agresija un datorspēles nav nekādā veidā saistītas, tad iespēja iegūt šādas vai vēl izteiktākas atšķirības bija 0,04."

Bet ko darīt, ja mēs iegūstam nenozīmīgas atšķirības? Vai tas nozīmē, ka starp pētāmajiem mainīgajiem nav nekādas saistības? Nē, tas nozīmē tikai to, ka var būt atšķirības, taču mūsu rezultāti neļāva mums tās atklāt.

Tas ir tieši saistīts ar pašas p-vērtības definīciju. 0,04 ir iespēja iegūt šīs vai pat ekstrēmākas atšķirības. Principā nav iespējams novērtēt varbūtību iegūt tieši tādas pašas atšķirības kā mūsu eksperimentā!

Šīs ir nepilnības, kuras var paslēpt tāda rādītāja kā p-vērtības interpretācijā. Tāpēc ir ļoti svarīgi izprast statistikas pamatrādītāju analīzes un aprēķināšanas metožu pamatā esošos mehānismus.

Kā atrast p-vērtību?

1. Nosakiet sava eksperimenta paredzamos rezultātus

Parasti, kad zinātnieki veic eksperimentu, viņiem jau ir priekšstats par to, kādi rezultāti tiek uzskatīti par “normāliem” vai “tipiskiem”. Tas var būt balstīts uz eksperimentāliem rezultātiem no pagātnes eksperimentiem, uz uzticamām datu kopām, uz datiem no zinātniskās literatūras, vai arī zinātnieks var paļauties uz dažiem citiem avotiem. Eksperimentam nosakiet sagaidāmos rezultātus un izsakiet tos kā skaitļus.

Piemērs. Piemēram, iepriekšējie pētījumi parādīja, ka jūsu valstī sarkanas automašīnas, visticamāk, saņems sodus par ātruma pārsniegšanu nekā zilas automašīnas. Piemēram, vidējie rezultāti parāda 2:1 priekšroku sarkanām automašīnām, nevis zilām automašīnām. Mēs vēlamies noskaidrot, vai policija ir līdzīgi neobjektīvi attiecībā uz automašīnu krāsu jūsu pilsētā. Lai to izdarītu, mēs analizēsim par ātruma pārsniegšanu uzliktos naudas sodus. Ja mēs nejauši izvēlētos 150 biļetes par ātruma pārsniegšanu, kas piešķirtas vai nu sarkanām, vai zilām automašīnām, mēs sagaidām, ka sarkanajām automašīnām tiks izsniegtas 100 biļetes, bet zilajām automašīnām - 50, ja mūsu pilsētā policija ir tikpat neobjektīva attiecībā uz automašīnu krāsu kā šī. novērota visā valstī.

2. Nosakiet sava eksperimenta novērojamos rezultātus.

Tagad, kad esat noteicis gaidāmos rezultātus, jums ir jāveic eksperiments un jāatrod faktiskās (vai "novērotās") vērtības. Atkal šie rezultāti ir jāatspoguļo kā skaitļi. Ja radām eksperimentālos apstākļus, un novērotie rezultāti atšķiras no gaidītajiem, tad mums ir divas iespējas – vai nu tas noticis nejauši, vai arī to izraisījis mūsu eksperiments. P-vērtības atrašanas mērķis ir noteikt, vai novērotie rezultāti tik ļoti atšķiras no sagaidāmajiem rezultātiem, ka var noraidīt "nulles hipotēzi" - hipotēzi, ka starp eksperimentālajiem mainīgajiem un novērotajiem rezultātiem nav saistību.

Piemērs. Piemēram, mūsu pilsētā mēs nejauši izvēlējāmies 150 soda zīmes par ātruma pārsniegšanu, kas tika izsniegtas vai nu sarkanām, vai zilām automašīnām. Noskaidrojām, ka sarkanās krāsas automašīnām tika sodīti 90 naudas sodi, bet zilām – 60. Tas atšķiras no sagaidāmajiem rezultātiem, kas ir attiecīgi 100 un 50. Vai mūsu eksperiments (šajā gadījumā datu avota maiņa no valsts uz pilsētu) patiešām izraisīja šīs rezultātu izmaiņas, vai arī mūsu pilsētas policija ir neobjektīva tāpat kā vidēji valstī, un mēs redzam tikai nejaušas izmaiņas? P vērtība mums palīdzēs to noteikt.

3. Nosakiet sava eksperimenta brīvības pakāpju skaitu

Brīvības pakāpju skaits ir jūsu eksperimenta mainīguma pakāpe, ko nosaka pārbaudīto kategoriju skaits. Brīvības pakāpju skaita vienādojums ir Brīvības pakāpju skaits = n-1, kur “n” ir kategoriju vai mainīgo skaits, ko analizējat savā eksperimentā.

Piemērs. Mūsu eksperimentā ir divas rezultātu kategorijas: viena kategorija sarkanām automašīnām un viena zilajām automašīnām. Tāpēc mūsu eksperimentā mums ir 2-1 = 1 brīvības pakāpe. Ja mēs salīdzinātu sarkanās, zilās un zaļās automašīnas, mums būtu 2 brīvības pakāpes utt.

4. Salīdziniet sagaidāmos un novērotos rezultātus, izmantojot hī kvadrāta testu

Hī kvadrāts (rakstīts "x2") ir skaitliska vērtība, kas mēra atšķirību starp eksperimenta paredzamajām un novērotajām vērtībām. Hī kvadrāta vienādojums ir x2 = Σ((o-e)2/e), kur “o” ir novērotā vērtība un “e” ir paredzamā vērtība. Apkopojiet šī vienādojuma rezultātus visiem iespējamiem rezultātiem (skatīt zemāk).

Ņemiet vērā, ka šis vienādojums ietver summēšanas operatoru Σ (sigma). Citiem vārdiem sakot, jums ir jāaprēķina ((|o-e|-.05)2/e) katram iespējamajam rezultātam un jāpievieno iegūtie skaitļi, lai iegūtu hī kvadrāta testa vērtību. Mūsu piemērā mums ir divi iespējamie iznākumi – vai nu automašīna, kas saņēma biļeti, ir sarkana vai zila. Tāpēc mums ir jāaprēķina ((o-e)2/e) divreiz - vienu reizi sarkanajām automašīnām un vienu zilajām automašīnām.

Piemērs: savienosim mūsu paredzamās un novērotās vērtības vienādojumā x2 = Σ((o-e)2/e). Atcerieties, ka summas operatora dēļ mums ir jāaprēķina ((o-e)2/e) divreiz - vienu reizi sarkanajām automašīnām un vienreiz zilajām automašīnām. Šo darbu veiksim šādi:
x2 = ((90-100)2/100) + (60-50)2/50)
x2 = ((-10)2/100) + (10)2/50)
x2 = (100/100) + (100/50) = 1 + 2 = 3.

5. Izvēlieties nozīmīguma līmeni

Tagad, kad mēs zinām mūsu eksperimenta brīvības pakāpju skaitu un zinām hī kvadrāta testa vērtību, mums ir jādara vēl viena lieta, pirms atrodam savu p vērtību. Mums ir jānosaka nozīmīguma līmenis. Runājot vienkāršā valodā, nozīmīguma līmenis norāda, cik pārliecināti esam par saviem rezultātiem. Zema nozīmīguma vērtība atbilst zemai varbūtībai, ka eksperimenta rezultāti radušies nejauši, un otrādi. Nozīmīguma līmeņi tiek rakstīti kā decimālskaitļi (piemēram, 0,01), kas atbilst varbūtībai, ka eksperimenta rezultāti tika iegūti nejauši (šajā gadījumā varbūtība ir 1%).

Pēc vienošanās zinātnieki parasti nosaka savu eksperimentu nozīmīguma līmeni uz 0,05 jeb 5%. Tas nozīmē, ka eksperimentāliem rezultātiem, kas atbilst šim nozīmīguma kritērijam, ir tikai 5% iespēja, ka tie rodas tikai nejauši. Citiem vārdiem sakot, pastāv 95% iespēja, ka rezultātus izraisīja veids, kā zinātnieks manipulēja ar eksperimentālajiem mainīgajiem, nevis nejaušība. Lielākajai daļai eksperimentu pietiek ar 95% pārliecību, ka pastāv attiecības starp diviem mainīgajiem lielumiem, lai uzskatītu, ka tie ir “tiešām” saistīti viens ar otru.

Piemērs: mūsu piemērā par sarkanām un zilām automašīnām sekosim zinātnieku vienprātībai un iestatīsim nozīmīguma līmeni uz 0,05.

6. Izmantojiet hī kvadrāta sadalījuma datu tabulu, lai atrastu savu p vērtību.

Zinātnieki un statistiķi izmanto lielas tabulas, lai aprēķinātu savu eksperimentu p-vērtību. Šajās tabulās parasti ir vertikālā ass kreisajā pusē, kas atbilst brīvības pakāpju skaitam, un horizontālā ass augšpusē, kas atbilst p vērtībai. Izmantojiet tabulas datus, lai vispirms atrastu savu brīvības pakāpju skaitu, pēc tam apskatiet sēriju no kreisās puses uz labo, līdz atrodat pirmo vērtību, kas ir lielāka par jūsu hī kvadrāta vērtību. Apskatiet atbilstošo p vērtību kolonnas augšdaļā. Jūsu p vērtība ir starp šo skaitli un nākamo (to, kas atrodas pa kreisi no jūsu).

Tabulas ar hī kvadrāta sadalījumu var iegūt no daudziem avotiem (vienu no tiem varat atrast šajā saitē).

Piemērs: mūsu hī kvadrāta testa vērtība bija 3. Tā kā mēs zinām, ka mūsu eksperimentā ir tikai 1 brīvības pakāpe, mēs atlasīsim pašu pirmo rindu. Mēs ejam no kreisās puses uz labo pa šo līniju, līdz mēs sastopam vērtību, kas ir lielāka par 3, mūsu hī kvadrāta testa vērtību. Pirmais, ko mēs atrodam, ir 3.84. Aplūkojot mūsu kolonnas augšdaļu, mēs redzam, ka atbilstošā p vērtība ir 0,05. Tas nozīmē, ka mūsu p vērtība ir no 0,05 līdz 0,1 (nākamā p vērtība tabulā augošā secībā).

7. Izlemiet, vai noraidīt vai paturēt savu nulles hipotēzi

Tā kā esat noteicis sava eksperimenta aptuveno p vērtību, jums ir jāizlemj, vai noraidīt eksperimenta nulles hipotēzi (atcerieties, ka šī ir hipotēze, ka eksperimentālie mainīgie, ar kuriem jūs manipulējāt, neietekmēja jūsu novērotos rezultātus). Ja jūsu p vērtība ir mazāka par jūsu nozīmīguma līmeni, apsveicam, jūs esat pierādījis, ka pastāv ļoti iespējama saistība starp mainīgajiem, ar kuriem jūs manipulējat, un jūsu novērotajiem rezultātiem. Ja jūsu p-vērtība ir augstāka par jūsu nozīmīguma līmeni, jūs nevarat droši pateikt, vai jūsu novērotie rezultāti ir radušies tīras nejaušības vai manipulācijas ar jūsu mainīgajiem dēļ.

Piemērs: mūsu p vērtība ir no 0,05 līdz 0,1. Tas nepārprotami nav mazāks par 0,05, tāpēc diemžēl mēs nevaram noraidīt mūsu nulles hipotēzi. Tas nozīmē, ka neesam sasnieguši minimālo 95% varbūtību teikt, ka policija mūsu pilsētā izsniedz biļetes uz sarkanzilajām automašīnām ar varbūtību, kas krasi atšķiras no valsts vidējā rādītāja.

Citiem vārdiem sakot, pastāv 5-10% iespēja, ka mūsu novērotie rezultāti nav atrašanās vietas maiņas sekas (pilsētas, nevis visas valsts analīze), bet gan vienkārši nejaušības dēļ. Tā kā mēs prasījām precizitāti, kas ir mazāka par 5%, mēs nevaram teikt, ka esam pārliecināti, ka mūsu pilsētā policija ir mazāk neobjektīva pret sarkanajām automašīnām - pastāv neliela (bet statistiski nozīmīga) iespēja, ka tā nav.

Psiholoģijas kursa, diplomdarbu un maģistra darbu statistisko aprēķinu rezultātu tabulās vienmēr ir rādītājs “p”.

Piemēram, saskaņā ar pētniecības mērķi Aprēķinātas pusaudžu zēnu un meiteņu dzīves jēgpilnības līmeņa atšķirības.

Vidējā vērtība

Mann-Whitney U tests

Statistiskā nozīmīguma līmenis (p)

Zēni (20 cilvēki)

Meitenes

(5 cilvēki)

Mērķi

28,9

35,2

17,5

0,027*

Process

30,1

32,0

38,5

0,435

Rezultāts

25,2

29,0

29,5

0,164

Kontroles vieta - "es"

20,3

23,6

0,067

Kontroles vieta - "Dzīve"

30,4

33,8

27,5

0,126

Jēgpilna dzīve

98,9

111,2

0,103

* - atšķirības ir statistiski nozīmīgas (lpp0,05)

Labajā kolonnā ir norādīta “p” vērtība, un tieši pēc tās vērtības var noteikt, vai atšķirības dzīves jēgpilnībā nākotnē starp zēniem un meitenēm ir būtiskas vai nē. Noteikums ir vienkāršs:

  • Ja statistiskā nozīmīguma līmenis “p” ir mazāks vai vienāds ar 0,05, tad secinām, ka atšķirības ir būtiskas. Zemāk redzamajā tabulā atšķirības starp zēniem un meitenēm ir būtiskas saistībā ar rādītāju “Mērķi” - dzīves jēgpilnība nākotnē. Meitenēm šis rādītājs ir statistiski nozīmīgi augstāks nekā zēniem.
  • Ja statistiskās nozīmības līmenis “p” ir lielāks par 0,05, tad tiek secināts, ka atšķirības nav būtiskas. Zemāk redzamajā tabulā atšķirības starp zēniem un meitenēm nav būtiskas attiecībā uz visiem pārējiem rādītājiem, izņemot pirmo.

No kurienes nāk statistiskā nozīmīguma līmenis “p”?

Tiek aprēķināts statistiskās nozīmīguma līmenis statistikas programma kopā ar statistiskā kritērija aprēķinu. Šajās programmās var iestatīt arī statistiskās nozīmīguma līmeņa kritisko robežu un atbilstošos rādītājus programma iezīmēs.

Piemēram, programmā STATISTICA, aprēķinot korelācijas, var iestatīt “p” robežu, piemēram, 0,05, un visas statistiski nozīmīgās attiecības tiks iezīmētas sarkanā krāsā.

Ja statistisko kritēriju aprēķina manuāli, tad nozīmīguma līmeni “p” nosaka, salīdzinot iegūtā kritērija vērtību ar kritisko vērtību.

Ko parāda statistiskā nozīmīguma līmenis “p”?

Visi statistikas aprēķini ir aptuveni. Šīs aproksimācijas līmenis nosaka “p”. Nozīmīguma līmeni raksta kā decimāldaļu, piemēram, 0,023 vai 0,965. Ja šo skaitli reizinām ar 100, iegūstam p rādītāju procentos: 2,3% un 96,5%. Šie procenti atspoguļo varbūtību, ka mūsu pieņēmumi par saistību starp, piemēram, agresiju un trauksmi ir nepareizi.

Tas ir, korelācijas koeficients 0,58 starp agresiju un trauksmi tika iegūts pie statistiskā nozīmīguma līmeņa 0,05 vai kļūdas varbūtības 5%. Ko tas īsti nozīmē?

Mūsu identificētā korelācija nozīmē, ka mūsu izlasē tiek novērots šāds modelis: jo augstāka agresivitāte, jo lielāka ir trauksme. Tas ir, ja ņemam divus pusaudžus, un vienam ir lielāka trauksme nekā otram, tad, zinot pozitīvo korelāciju, varam teikt, ka arī šim pusaudzim būs lielāka agresivitāte. Bet tā kā statistikā viss ir aptuvens, tad, to norādot, mēs pieļaujam, ka varam kļūdīties, un kļūdas iespējamība ir 5%. Tas ir, veicot 20 šādus salīdzinājumus šajā pusaudžu grupā, mēs varam pieļaut vienu kļūdu, prognozējot agresivitātes līmeni, zinot trauksmi.

Kurš statistiskās nozīmīguma līmenis ir labāks: 0,01 vai 0,05

Statistiskā nozīmīguma līmenis atspoguļo kļūdas iespējamību. Tāpēc rezultāts pie p=0,01 ir precīzāks nekā pie p=0,05.

Psiholoģijas pētījumos tiek pieņemti divi pieņemami rezultātu statistiskās nozīmīguma līmeņi:

p=0,01 - augsta rezultāta ticamība salīdzinošā analīze vai attiecību analīze;

p=0,05 - pietiekama precizitāte.

Es ceru, ka šis raksts palīdzēs jums pašam uzrakstīt psiholoģijas rakstu. Ja nepieciešama palīdzība, lūdzu, sazinieties ar mums (visu veidu darbs psiholoģijā; statistikas aprēķini).