Ինչպես հաշվարկել վիճակագրական նշանակության մակարդակը: Բացատրե՛ք, թե որն է վիճակագրական նշանակության մակարդակը

Մի շարք չափումների միջոցով որոշված ​​նմուշի բաշխման պարամետրերը պատահական փոփոխականներ են, հետևաբար դրանց շեղումները ընդհանուր պարամետրերից նույնպես պատահական կլինեն: Այս շեղումների գնահատումն իր բնույթով հավանական է. վիճակագրական վերլուծության մեջ կարելի է նշել միայն որոշակի սխալի հավանականությունը:

Եկեք ընդհանուր պարամետրի համար աստացված փորձի անաչառ գնահատականից ա*. Մենք վերագրում ենք բավականաչափ մեծ հավանականություն b (այնպես, որ b հավանականությամբ իրադարձությունը կարող է գործնականորեն որոշակի համարվել) և գտնում ենք այնպիսի արժեք e b = զբ) որի համար

Սխալի գործնականում հնարավոր արժեքների շրջանակը, որը տեղի է ունենում փոխարինելիս ավրա ա* , կլինի ±e b . Սխալները, որոնք մեծ են բացարձակ արժեքով, կհայտնվեն միայն փոքր հավանականությամբ:

կանչեց նշանակության մակարդակը. Հակառակ դեպքում, արտահայտությունը (4.1) կարող է մեկնաբանվել որպես պարամետրի իրական արժեքի հավանականություն աընկած է ներսում

. (4.3)

b հավանականությունը կոչվում է վստահության մակարդակըև բնութագրում է ստացված գնահատման հուսալիությունը: Ինտերվալ Ի b= ա* ± e b կոչվում է վստահության միջակայք. Ինտերվալների սահմանները ա¢ = ա* - ե բ եւ ա¢¢ = ա* + e b կոչվում են վստահության սահմանները. Վստահության միջակայքը տվյալ վստահության մակարդակում որոշում է գնահատման ճշգրտությունը: Վստահության միջակայքի արժեքը կախված է վստահության մակարդակից, որով երաշխավորված է գտնել պարամետրը ավստահության միջակայքի ներսում. որքան մեծ է b-ի արժեքը, այնքան մեծ է միջակայքը Ի b (և e b-ի արժեքը): Փորձերի քանակի աճը դրսևորվում է վստահության միջակայքի կրճատմամբ՝ հաստատուն վստահության հավանականությամբ կամ վստահության հավանականության մեծացմամբ՝ պահպանելով վստահության միջակայքը։

Գործնականում սովորաբար ֆիքսվում է վստահության հավանականության արժեքը (0,9; 0,95 կամ 0,99), այնուհետև որոշում է արդյունքի վստահության միջակայքը: Իբ. Վստահության միջակայք կառուցելիս բացարձակ շեղման խնդիրը լուծվում է.

Այսպիսով, եթե գնահատման բաշխման օրենքը հայտնի լիներ ա* , վստահության միջակայքը որոշելու խնդիրը կլուծվեր պարզապես. Դիտարկենք վստահության միջակայքի կառուցումը նորմալ բաշխված պատահական փոփոխականի մաթեմատիկական ակնկալիքի համար Xհայտնի ընդհանուր ստանդարտով նմուշի չափի նկատմամբ n. Լավագույն սահմանը ակնկալիքների համար մընտրանքային միջինն է միջինի ստանդարտ շեղումով

.

Օգտագործելով Laplace ֆունկցիան՝ ստանում ենք

. (4.5)

Հաշվի առնելով b վստահության հավանականությունը՝ մենք արժեքը որոշում ենք Լապլասի ֆունկցիայի աղյուսակից (Հավելված 1) . Այնուհետև ձև է ստանում մաթեմատիկական ակնկալիքի վստահության միջակայքը

. (4.7)

(4.7)-ից երևում է, որ վստահության միջակայքի նվազումը հակադարձ համեմատական ​​է փորձերի քանակի քառակուսի արմատին։

Ընդհանուր շեղումը իմանալը մեզ թույլ է տալիս գնահատել մաթեմատիկական ակնկալիքը նույնիսկ մեկ դիտարկման համար: Եթե ​​նորմալ բաշխված պատահական փոփոխականի համար Xփորձի արդյունքում արժեքը X 1, ապա ընտրված b-ի համար մաթեմատիկական ակնկալիքի վստահության միջակայքն ունի ձև

որտեղ U 1-էջ/2 - ստանդարտ նորմալ բաշխման քվենտիլ (Հավելված 2):

Գնահատականների բաշխման օրենքը ա* կախված է քանակի բաշխման օրենքից Xև, մասնավորապես, հենց պարամետրի վրա ա. Այս դժվարությունը շրջանցելու համար մաթեմատիկական վիճակագրության մեջ օգտագործվում են երկու մեթոդ.

1) մոտավոր - ժամը n³ 50 փոխարինել e b արտահայտության անհայտ պարամետրերը իրենց գնահատականներով, օրինակ.

2) պատահական փոփոխականից ա* անցեք մեկ այլ պատահական փոփոխական Q * , որի բաշխման օրենքը կախված չէ գնահատված պարամետրից ա, բայց կախված է միայն նմուշի չափից: nև քանակի բաշխման օրենքի տեսակի վրա X. Այս տեսակի քանակները առավել մանրամասն ուսումնասիրվել են պատահական փոփոխականների նորմալ բաշխման համար: Սիմետրիկ քվանտիլները սովորաբար օգտագործվում են որպես Q¢ և Q¢¢ վստահության սահմաններ

, (4.9)

կամ հաշվի առնելով (4.2)

. (4.10)

4.2. Վիճակագրական վարկածների փորձարկում, նշանակության թեստեր,

առաջին և երկրորդ տեսակի սխալներ.

Տակ վիճակագրական վարկածներհասկանալի են որոշ ենթադրություններ այս կամ այն ​​պատահական փոփոխականների ընդհանուր բնակչության բաշխումների վերաբերյալ: Վարկածների թեստավորումը հասկացվում է որպես որոշ վիճակագրական ցուցանիշների համեմատություն, ստուգման չափանիշներ (նշանակության չափանիշներ) հաշվարկված նմուշից՝ դրանց արժեքներով որոշված՝ տվյալ վարկածի ճշմարիտ լինելու ենթադրությամբ: Հիպոթեզները ստուգելիս սովորաբար որոշ վարկածներ են ստուգվում: Հ 0՝ համեմատած այլընտրանքային վարկածի հետ Հ 1 .

Վարկածն ընդունել-մերժել-որոշելու համար տրվում է նշանակության մակարդակը Ռ. Առավել հաճախ օգտագործվող նշանակության մակարդակներն են 0.10, 0.05 և 0.01: Ըստ այդ հավանականության, օգտագործելով Q * գնահատման բաշխման վարկածը (նշանակության չափանիշ), հայտնաբերվում են քանակական վստահության սահմաններ, որպես կանոն, սիմետրիկ Q. էջ/2 և Q 1- էջ/2. Q թվեր էջ/2 և Q 1- էջ/2 կոչվում են վարկածի կրիտիկական արժեքները; Q արժեքներ *< Qէջ/2 և Q * > Q 1- էջ/2 ձեւավորել քննադատական


վարկածի տարածքը (կամ վարկածի չընդունման տարածքը) (նկ. 12):

Բրինձ. 12.Կրիտիկական տարածք Բրինձ. 13.Ստուգում վիճակագրական

վարկածներ. վարկածներ.

Եթե ​​նմուշում հայտնաբերված Q 0-ն ընկնում է Q-ի միջև էջ/2 և Q 1- էջ/2 , ապա վարկածն ընդունում է նման արժեքը որպես պատահական և, հետևաբար, այն մերժելու հիմքեր չկան։ Եթե ​​Q 0-ի արժեքը ընկնում է կրիտիկական տարածաշրջանում, ապա այս վարկածի համաձայն, դա գործնականում անհնար է: Բայց քանի որ հայտնվել է, հիպոթեզն ինքնին մերժվում է։

Գոյություն ունեն երկու տեսակի սխալներ, որոնք կարող են արվել հիպոթեզների փորձարկման ժամանակ: I տեսակի սխալդա է մերժելով վարկածը, որն իրականում ճիշտ է. Նման սխալի հավանականությունը մեծ չէ ընդունված նշանակության մակարդակից։ II տեսակի սխալդա է վարկածն ընդունված է, բայց իրականում կեղծ է. Այս սխալի հավանականությունը որքան ցածր է, այնքան բարձր է նշանակության մակարդակը, քանի որ դա մեծացնում է մերժված վարկածների թիվը: Եթե ​​երկրորդ տեսակի սխալի հավանականությունը a է, ապա կոչվում է արժեքը (1 - ա): չափանիշի ուժը.

Նկ. 13-ը ցույց է տալիս Q պատահական փոփոխականի բաշխման խտության երկու կորեր, որոնք համապատասխանում են երկու վարկածին Հ 0 և Հմեկ . Եթե ​​փորձից ստացված արժեքը Q > Q է էջ, ապա վարկածը մերժվում է։ Հ 0, և վարկածն ընդունված է Հ 1, և հակառակը, եթե Ք< Qէջ.

Հավանականության խտության կորի տակ գտնվող տարածքը, որը համապատասխանում է վարկածի վավերությանը Հ 0 Q արժեքից աջ էջ, հավասար է նշանակության մակարդակին Ռ, այսինքն՝ առաջին տեսակի սխալի հավանականությունը։ Հավանականության խտության կորի տակ գտնվող տարածքը, որը համապատասխանում է վարկածի վավերությանը ՀՔ–ից ձախ 1 էջ, հավասար է երկրորդ տեսակի սխալի հավանականությանը a, իսկ Q-ից աջ էջ- չափանիշի հզորությունը (1 - ա). Այսպիսով, այնքան ավելի Ռ, այնքան ավելի (1 - ա). Հիպոթեզը ստուգելիս նրանք փորձում են բոլոր հնարավոր չափանիշներից ընտրել այն չափանիշը, որը նշանակության տվյալ մակարդակի դեպքում ունի II տիպի սխալի ավելի քիչ հավանականություն։.

Սովորաբար, որպես հիպոթեզների փորձարկման ժամանակ նշանակության օպտիմալ մակարդակ, օգտագործել էջ= 0.05, քանի որ եթե փորձարկվող վարկածն ընդունվում է նշանակության որոշակի մակարդակով, ապա վարկածը, իհարկե, պետք է ճանաչվի որպես փորձարարական տվյալներին համապատասխան. մյուս կողմից, նշանակության այս մակարդակի օգտագործումը հիմքեր չի տալիս վարկածը մերժելու համար։

Օրինակ, գտնվել են երկու արժեք և որոշ նմուշային պարամետր, որոնք կարող են համարվել որպես ընդհանուր պարամետրերի գնահատումներ ա 1 և ա 2. Ենթադրվում է, որ և միջև տարբերությունը պատահական է, և որ ընդհանուր պարամետրերը ա 1 և ա 2-ը հավասար են միմյանց, այսինքն. ա 1 = ա 2. Այս վարկածը կոչվում է դատարկ, կամ զրոյական վարկած. Այն փորձարկելու համար անհրաժեշտ է պարզել, թե արդյոք և միջև անհամապատասխանությունը նշանակալի է զրո վարկածի ներքո: Դա անելու համար սովորաբար ուսումնասիրվում է D = – պատահական փոփոխականը և ստուգում, թե արդյոք դրա տարբերությունը զրոյից նշանակալի է: Երբեմն ավելի հարմար է արժեքը դիտարկել / համեմատելով այն միասնության հետ։

Մերժելով զրոյական վարկածը՝ նրանք ընդունում են այլընտրանքայինը, որը բաժանվում է երկուսի՝ > և< . Если одно из этих равенств заведомо невозможно, то альтернативная гипотеза называется միակողմանի, և ստուգելու համար օգտագործեք միակողմանինշանակության չափանիշները (ի տարբերություն սովորական, երկկողմանի) Այս դեպքում անհրաժեշտ է դիտարկել միայն կրիտիկական շրջանի կեսերից մեկը (նկ. 12):

Օրինակ, Ռ= 0,05 երկկողմանի չափանիշով, կրիտիկական արժեքները Q 0,025 և Q 0,975 համապատասխանում են, այսինքն, Q *, որոնք վերցրել են Q * արժեքները, համարվում են նշանակալի (ոչ պատահական)< Q 0.025 и Q * >Q 0.975. Միակողմանի չափանիշով այս անհավասարություններից մեկն ակնհայտորեն անհնար է (օրինակ՝ Q *< Q 0.025) и значимыми будут лишь Q * >Q 0.975. Վերջին անհավասարության հավանականությունը 0,025 է, հետևաբար նշանակալիության մակարդակը կլինի 0,025: Այսպիսով, եթե միակողմանի նշանակության թեստի համար օգտագործվեն նույն կրիտիկական թվերը, ինչ երկու պոչով, ապա այդ արժեքները կհամապատասխանեն նշանակության մակարդակի կեսին:

Սովորաբար, միակողմանի թեստի համար նշանակության նույն մակարդակն է վերցվում, ինչ երկու պոչով թեստի դեպքում, քանի որ այս պայմաններում երկու թեստերն էլ տալիս են նույն տիպի I սխալը: Դա անելու համար միակողմանի թեստը պետք է բխի երկու պոչից, որը համապատասխանում է ընդունվածից երկու անգամ մեծ նշանակության մակարդակին:. Միակողմանի թեստի նշանակության մակարդակը պահպանելու համար Ռ= 0.05, երկկողմանի համար անհրաժեշտ է վերցնել Ռ= 0,10, որը տալիս է Q 0,05 և Q 0,95 կրիտիկական արժեքները: Դրանցից, միակողմանի թեստի համար, կմնա մեկը, օրինակ, Q 0.95: Միակողմանի թեստի համար նշանակալի մակարդակը 0,05 է: Երկկողմանի թեստի համար նույն նշանակության մակարդակը համապատասխանում է Q 0,975 կրիտիկական արժեքին: Բայց Q 0.95< Q 0.975 , значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода.

Վիճակագրության մեջ նշանակության մակարդակը կարևոր ցուցանիշ է, որն արտացոլում է ստացված (կանխատեսված) տվյալների ճշգրտության և ճշմարտացիության նկատմամբ վստահության աստիճանը։ Հայեցակարգը լայնորեն կիրառվում է տարբեր ոլորտներում՝ սոցիոլոգիական հետազոտություններից մինչև գիտական ​​վարկածների վիճակագրական փորձարկում:

Սահմանում

Վիճակագրական նշանակության (կամ վիճակագրորեն նշանակալի արդյունքի) մակարդակը ցույց է տալիս, թե որքան է ուսումնասիրված ցուցանիշների պատահական առաջացման հավանականությունը։ Երևույթի ընդհանուր վիճակագրական նշանակությունն արտահայտվում է p արժեքով (p մակարդակ)։ Ցանկացած փորձի կամ դիտարկման ժամանակ կա հավանականություն, որ ստացված տվյալները առաջացել են նմուշառման սխալների պատճառով: Սա հատկապես ճիշտ է սոցիոլոգիայի համար:

Այսինքն՝ վիճակագրորեն նշանակալի է այն արժեքը, որի պատահական առաջացման հավանականությունը չափազանց փոքր է կամ հակված է ծայրահեղությունների: Այս համատեքստում ծայրահեղությունը վիճակագրության շեղման աստիճանն է զրոյական հիպոթեզից (հիպոթեզ, որը ստուգվում է ստացված ընտրանքի տվյալների հետ համապատասխանության համար): Գիտական ​​պրակտիկայում նշանակալիության մակարդակն ընտրվում է տվյալների հավաքագրումից առաջ և, որպես կանոն, դրա գործակիցը կազմում է 0,05 (5%)։ Համակարգերի համար, որտեղ ճշգրիտ արժեքները կարևոր են, դա կարող է լինել 0,01 (1%) կամ ավելի քիչ:

Նախապատմություն

Նշանակության մակարդակի հասկացությունը ներկայացվել է բրիտանացի վիճակագիր և գենետիկ Ռոնալդ Ֆիշերի կողմից 1925 թվականին, երբ նա մշակում էր վիճակագրական վարկածների փորձարկման տեխնիկա։ Ցանկացած գործընթաց վերլուծելիս կա որոշակի երեւույթների որոշակի հավանականություն։ Դժվարություններ են առաջանում հավանականությունների փոքր (կամ ոչ ակնհայտ) տոկոսների հետ աշխատելիս, որոնք ընկնում են «չափման սխալ» հասկացության ներքո։

Վիճակագրության հետ աշխատելիս, որոնք բավականաչափ կոնկրետ չէին փորձարկվելու համար, գիտնականները բախվում էին զրոյական վարկածի խնդրին, որը «կանխում է» փոքր արժեքներով աշխատելը: Ֆիշերը նման համակարգերի համար առաջարկել է իրադարձությունների հավանականությունը որոշել 5% (0,05)՝ որպես հարմար նմուշի կտրվածք, որը թույլ է տալիս մերժել զրոյական վարկածը հաշվարկներում:

Ֆիքսված գործակցի ներդրում

1933 թվականին Եժի գիտնականներՆոյմանը և Էգոն Փիրսոնն իրենց աշխատություններում խորհուրդ են տվել նախօրոք սահմանել որոշակի նշանակության մակարդակ (նախքան տվյալների հավաքագրումը): Այս կանոնների կիրառման օրինակները հստակ տեսանելի են ընտրությունների ժամանակ։ Ենթադրենք՝ երկու թեկնածու կա, որոնցից մեկը շատ սիրված է, մյուսը՝ հայտնի չէ։ Ակնհայտ է, որ ընտրություններում հաղթելու է առաջին թեկնածուն, իսկ երկրորդի շանսերը զրոյի են ձգտում։ Ձգտել, բայց ոչ հավասար. միշտ կա ֆորսմաժորային, սենսացիոն տեղեկատվության, անսպասելի որոշումների հավանականություն, որոնք կարող են փոխել ընտրությունների կանխատեսված արդյունքները։

Նոյմանը և Փիրսոնը համաձայնեցին, որ Ֆիշերի առաջարկած նշանակության մակարդակը՝ 0,05 (նշվում է α խորհրդանիշով) ամենահարմարն է։ Այնուամենայնիվ, ինքը՝ Ֆիշերը, 1956 թվականին դեմ է արտահայտվել այս արժեքի ամրագրմանը։ Նա կարծում էր, որ α-ի մակարդակը պետք է սահմանվի կոնկրետ հանգամանքներին համապատասխան։ Օրինակ՝ մասնիկների ֆիզիկայում այն ​​0,01 է։

p-արժեքը

p-արժեք տերմինն առաջին անգամ օգտագործվել է Բրաունլիի կողմից 1960 թվականին։ P-մակարդակը (p-արժեք) ցուցիչ է, որը հակադարձ առնչություն ունի արդյունքների ճշմարտացիության հետ: Ամենաբարձր p-արժեքը համապատասխանում է փոփոխականների միջև ընտրված հարաբերությունների վստահության ամենացածր մակարդակին:

Այս արժեքը արտացոլում է արդյունքների մեկնաբանման հետ կապված սխալների հավանականությունը: Ենթադրենք p-արժեք = 0,05 (1/20): Այն ցույց է տալիս հինգ տոկոս հավանականություն, որ ընտրանքում հայտնաբերված փոփոխականների միջև կապը պարզապես ընտրանքի պատահական հատկանիշ է: Այսինքն, եթե այս կախվածությունը բացակայում է, ապա կրկնվող նմանատիպ փորձերի դեպքում, միջին հաշվով, յուրաքանչյուր քսաներորդ ուսումնասիրության դեպքում կարելի է ակնկալել նույն կամ ավելի մեծ կախվածություն փոփոխականների միջև: Հաճախ p-մակարդակը համարվում է սխալի մակարդակի «մարժա»:

Ի դեպ, p-արժեքը կարող է չարտացոլել փոփոխականների իրական հարաբերությունները, այլ միայն ցույց է տալիս որոշակի միջին արժեք ենթադրությունների շրջանակներում: Մասնավորապես, տվյալների վերջնական վերլուծությունը նույնպես կախված կլինի այս գործակցի ընտրված արժեքներից։ p-level = 0.05-ի դեպքում կլինեն որոշ արդյունքներ, իսկ 0.01-ին հավասար գործակցով` մյուսները:

Վիճակագրական վարկածների փորձարկում

Վիճակագրական նշանակության մակարդակը հատկապես կարևոր է վարկածները ստուգելիս: Օրինակ, երկկողմանի թեստը հաշվարկելիս մերժման տարածքը հավասարապես բաժանվում է նմուշառման բաշխման երկու ծայրերում (զրոյական կոորդինատի համեմատ) և հաշվարկվում է ստացված տվյալների ճշմարտացիությունը:

Ենթադրենք, որոշակի գործընթացի (երևույթի) մոնիտորինգի ժամանակ պարզվեց, որ նոր վիճակագրական տեղեկատվությունը ցույց է տալիս փոքր փոփոխություններ նախորդ արժեքների համեմատ: Միևնույն ժամանակ, արդյունքների անհամապատասխանությունները փոքր են, ոչ ակնհայտ, բայց կարևոր ուսումնասիրության համար։ Մասնագետը կանգնած է երկընտրանքի առաջ՝ փոփոխություններն իրո՞ք տեղի են ունենում, թե՞ ընտրանքային սխալներ են (չափման անճշտություն):

Այս դեպքում կիրառվում կամ մերժվում է զրոյական վարկածը (ամեն ինչ դուրս է գրվում որպես սխալ, կամ համակարգի փոփոխությունը ճանաչվում է որպես կատարված փաստ): Խնդրի լուծման գործընթացը հիմնված է ընդհանուր վիճակագրական նշանակության (p-արժեք) և նշանակության մակարդակի (α) հարաբերակցության վրա։ Եթե ​​p- մակարդակը< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Օգտագործված արժեքներ

Նշանակության մակարդակը կախված է վերլուծված նյութից։ Գործնականում օգտագործվում են հետևյալ ֆիքսված արժեքները.

  • α = 0.1 (կամ 10%);
  • α = 0.05 (կամ 5%);
  • α = 0.01 (կամ 1%);
  • α = 0,001 (կամ 0,1%):

Որքան ճշգրիտ են պահանջվում հաշվարկները, այնքան փոքր է օգտագործվում α գործակիցը: Բնականաբար, ֆիզիկայի, քիմիայի, դեղագործության և գենետիկայի վիճակագրական կանխատեսումները պահանջում են ավելի մեծ ճշգրտություն, քան քաղաքագիտության և սոցիոլոգիայի մեջ:

Նշանակության շեմերը կոնկրետ ոլորտներում

Բարձր ճշգրտության ոլորտներում, ինչպիսիք են մասնիկների ֆիզիկան և արտադրությունը, վիճակագրական նշանակությունը հաճախ արտահայտվում է որպես ստանդարտ շեղման հարաբերակցություն (նշվում է սիգմա - σ գործակցով) նորմալ հավանականության բաշխման (Գաուսյան բաշխում) նկատմամբ։ σ-ը վիճակագրական ցուցանիշ է, որը որոշում է որոշակի քանակի արժեքների տարածումը մաթեմատիկական ակնկալիքների համեմատ: Օգտագործվում է իրադարձությունների հավանականությունը գծագրելու համար:

Կախված գիտելիքների ոլորտից՝ σ գործակիցը մեծապես տարբերվում է։ Օրինակ՝ Հիգսի բոզոնի գոյությունը կանխատեսելիս σ պարամետրը հավասար է հինգի (σ=5), որը համապատասխանում է p-արժեք=1/3,5 միլիոն տարածքներին։

Արդյունավետություն

Պետք է հաշվի առնել, որ α և p-արժեք գործակիցները ճշգրիտ բնութագրեր չեն։ Ինչպիսին էլ լինի նշանակության մակարդակը ուսումնասիրվող երեւույթի վիճակագրության մեջ, այն անվերապահ հիմք չէ վարկածն ընդունելու համար։ Օրինակ, որքան փոքր է α-ի արժեքը, այնքան մեծ է հավանականությունը, որ հաստատված վարկածը նշանակալի է: Այնուամենայնիվ, կա սխալի վտանգ, ինչը նվազեցնում է ուսումնասիրության վիճակագրական հզորությունը (նշանակությունը):

Հետազոտողները, ովքեր կենտրոնանում են բացառապես վիճակագրորեն նշանակալի արդյունքների վրա, կարող են սխալ եզրակացություններ անել: Միևնույն ժամանակ, դժվար է կրկնակի ստուգել նրանց աշխատանքը, քանի որ նրանք կիրառում են ենթադրություններ (որոնք, ըստ էության, α և p արժեքի արժեքներն են): Ուստի միշտ խորհուրդ է տրվում վիճակագրական նշանակության հաշվարկին զուգահեռ որոշել ևս մեկ ցուցանիշ՝ վիճակագրական էֆեկտի մեծությունը։ Էֆեկտի չափը էֆեկտի ուժի քանակական չափումն է:

Արժեքը կոչվում է վիճակագրորեն նշանակալի, եթե դրա զուտ պատահական առաջացման կամ նույնիսկ ավելի ծայրահեղ արժեքների հավանականությունը փոքր է։ Այստեղ ծայրահեղությունը զրոյական վարկածից շեղման աստիճանն է։ Տարբերությունը համարվում է «վիճակագրորեն նշանակալի», եթե կան տվյալներ, որոնք դժվար թե տեղի ունենան՝ ենթադրելով, որ տարբերությունը գոյություն չունի. այս արտահայտությունը չի նշանակում, որ այդ տարբերությունը պետք է լինի մեծ, կարևոր կամ նշանակալից բառի ընդհանուր իմաստով:

Թեստի նշանակության մակարդակը հաճախականության վիճակագրության մեջ հիպոթեզի փորձարկման ավանդական հասկացությունն է: Այն սահմանվում է որպես զրոյական հիպոթեզը մերժելու որոշում կայացնելու հավանականություն, եթե, ըստ էության, զրոյական վարկածը ճշմարիտ է (որոշումը հայտնի է որպես տիպի I սխալ կամ կեղծ դրական որոշում): Որոշման գործընթացը հաճախ հիմնվում է p արժեքի վրա: (կարդացեք «pi-արժեք»). եթե p-արժեքը փոքր է նշանակալի մակարդակից, ապա զրոյական վարկածը մերժվում է: Որքան փոքր է p-արժեքը, այնքան ավելի նշանակալի է համարվում թեստի վիճակագրությունը: Որքան փոքր է p-արժեքը, այնքան ուժեղ է զրոյական վարկածը մերժելու պատճառը:

Նշանակության մակարդակը սովորաբար նշվում է հունարեն α (ալֆա) տառով։ Հանրաճանաչ նշանակության մակարդակները կազմում են 5%, 1% և 0.1%: Եթե ​​թեստը արտադրում է α-մակարդակից պակաս p արժեք, ապա զրոյական վարկածը մերժվում է: Նման արդյունքները ոչ պաշտոնապես կոչվում են «վիճակագրորեն նշանակալի»: Օրինակ, եթե ինչ-որ մեկն ասում է, որ «տեղի ունեցածի հավանականությունը հազարից մեկ պատահականություն է», ապա նկատի ունի 0,1% նշանակության մակարդակ։

α մակարդակի տարբեր արժեքներ ունեն իրենց առավելություններն ու թերությունները: Ավելի փոքր α-մակարդակները ավելի մեծ վստահություն են տալիս, որ արդեն իսկ հաստատված այլընտրանքային վարկածը նշանակալի է, սակայն կեղծ զրոյական վարկածը չմերժելու ավելի մեծ ռիսկ կա (Տիպի II սխալ կամ «կեղծ բացասական որոշում») և, հետևաբար, ավելի քիչ վիճակագրական հզորություն: α-մակարդակի ընտրությունը անխուսափելիորեն պահանջում է փոխզիջում նշանակության և հզորության, հետևաբար՝ I և II տիպի սխալի հավանականությունների միջև: Կենցաղային գիտական ​​աշխատություններհաճախ «վիճակագրական նշանակություն» տերմինի փոխարեն օգտագործվում է ոչ ճիշտ «նշանակություն» տերմինը։

տես նաեւ

Նշումներ

Ջորջ Կազելլա, Ռոջեր Լ. ԲերգերՎարկածների փորձարկում // Վիճակագրական եզրակացություն. - Երկրորդ հրատարակություն. - Pacific Grove, CA: Duxbury, 2002. - S. 397. - 660 p. - ISBN 0-534-24312-6


Վիքիմեդիա հիմնադրամ. 2010 թ .

Տեսեք, թե ինչ է «Նշանակության մակարդակը» այլ բառարաններում.

    Թիվն այնքան փոքր է, որ կարելի է գրեթե վստահ համարել, որ α հավանականությամբ իրադարձություն չի լինի մեկ փորձի ժամանակ։ Սովորաբար U. z. ամրագրված է կամայականորեն, այն է՝ 0.05, 0.01 և հատուկ ճշգրտությամբ 0.005 և այլն։ Գեոլ. աշխատանք…… Երկրաբանական հանրագիտարան

    նշանակության մակարդակը- վիճակագրական չափանիշը (այն նաև կոչվում է «ալֆա մակարդակ» և նշվում է հունարեն տառով) I տիպի սխալի հավանականության վերին սահմանն է (զրոյական վարկածը մերժելու հավանականությունը, երբ այն իրականում ճիշտ է): Տիպիկ արժեքներն են... Սոցիոլոգիական վիճակագրության բառարան

    Անգլերեն մակարդակ, նշանակություն; գերմաներեն Signifikanzniveau. Ռիսկի աստիճանը կայանում է նրանում, որ հետազոտողը կարող է սխալ եզրակացություն անել հավելյալների՝ ընտրանքային տվյալների վրա հիմնված վարկածների սխալ եզրակացության մասին: Անտինազի. Սոցիոլոգիայի հանրագիտարան, 2009 ... Սոցիոլոգիայի հանրագիտարան

    նշանակության մակարդակը- - [Լ.Գ. Սումենկո. Անգլերեն ռուսերեն տեղեկատվական տեխնոլոգիաների բառարան. M .: GP TsNIIS, 2003: Տեղեկատվական տեխնոլոգիաների թեմաները ընդհանուր առմամբ EN մակարդակի նշանակության ... Տեխնիկական թարգմանչի ձեռնարկ

    նշանակության մակարդակը- 3.31 նշանակության մակարդակ α. տրված արժեք, որը ներկայացնում է վիճակագրական վարկածը մերժելու հավանականության վերին սահմանը, երբ այդ վարկածը ճշմարիտ է: Աղբյուր՝ ԳՕՍՏ Ռ ԻՍՕ 12491 2011. Շինանյութեր և արտադրանք։ Նորմատիվային և տեխնիկական փաստաթղթերի տերմինների բառարան-տեղեկատու

    ՆՇԱՆԱԿՈՒԹՅԱՆ ՄԱՐԴԱԿ- մաթեմատիկական վիճակագրության հայեցակարգը, որն արտացոլում է ընտրանքային տվյալների հիման վրա ստուգված հատկանիշի բաշխման վերաբերյալ վիճակագրական վարկածի վերաբերյալ սխալ եզրակացության հավանականության աստիճանը: Բավարար մակարդակի հոգեբանական հետազոտության մեջ ... ... Ժամանակակից ուսումնական գործընթացՀիմնական հասկացություններ և տերմիններ

    նշանակության մակարդակը- reikšmingumo lygis statusas T sritis automatika atitikmenys՝ անգլ. նշանակության մակարդակ vok. Signifikanzniveau, n rus. նշանակության մակարդակ, m pranc. կարևոր նշանակություն, մ … Ավտոմատ տերմինալներ

    նշանակության մակարդակը- reikšmingumo lygis statusas T sritis fizika atitikmenys՝ անգլ. նշանակության մակարդակ; նշանակության մակարդակ vok. Sicherheitsschwelle, f rus. նշանակության մակարդակ, fpranc. կարևոր նշանակություն, m … Fizikos Terminų žodynas

    Վիճակագրական թեստ, տես Նշանակության մակարդակ... Խորհրդային մեծ հանրագիտարան

    ՆՇԱՆԱԿՈՒԹՅԱՆ ՄԱՐԴԱԿ- Տես նշանակությունը, մակարդակը... Բառարանհոգեբանության մեջ

Գրքեր

  • "Հույժ գաղտնի" . Լուբյանկա - Ստալինին երկրում տիրող իրավիճակի մասին (1922-1934 թթ.): Հատոր 4. Մաս 1,. Թղթերի բազմահատոր հիմնարար հրատարակություն - տեղեկատվական ակնարկներև OGPU-ի ամփոփագրերը - եզակի է իր գիտական ​​նշանակությամբ, արժեքով, բովանդակությամբ և ծավալով: Այս պատմական…
  • Կրթական ծրագիր՝ որպես մասնագիտական ​​կրթության որակի կառավարման համակարգի գործիք, Տկաչևա Գալինա Վիկտորովնա, Լոգաչև Մաքսիմ Սերգեևիչ, Սամարին Յուրի Նիկոլաևիչ: Մենագրությունը վերլուծում է մասնագիտական ​​կրթական ծրագրերի բովանդակության ձևավորման առկա պրակտիկան։ Տեղը, կառուցվածքը, բովանդակությունը և նշանակության աստիճանը որոշվում են ...

p-արժեքը(անգլ.) - արժեք, որն օգտագործվում է վիճակագրական վարկածների փորձարկման ժամանակ: Փաստորեն, սա սխալի հավանականությունն է, երբ մերժում է զրո վարկածը (առաջին տեսակի սխալ): Վարկածների փորձարկումը՝ օգտագործելով P-արժեքը, այլընտրանք է դասական թեստավորման ընթացակարգին բաշխման կրիտիկական արժեքի միջոցով:

Սովորաբար, P-արժեքը հավասար է հավանականությանը, որ տվյալ բաշխմամբ պատահական փոփոխականը (փորձարկման վիճակագրության բաշխումը զրոյական հիպոթեզով) կվերցնի թեստային վիճակագրության իրական արժեքից ոչ պակաս արժեք: Վիքիպեդիա.

Այլ կերպ ասած, p-արժեքը նշանակության ամենափոքր մակարդակն է (այսինքն՝ իրական վարկածը մերժելու հավանականությունը), որի համար հաշվարկված թեստի վիճակագրությունը հանգեցնում է զրոյական վարկածի մերժմանը: Սովորաբար, p-արժեքը համեմատվում է ընդհանուր ընդունված ստանդարտ նշանակության մակարդակների հետ՝ 0,005 կամ 0,01:

Օրինակ, եթե նմուշից հաշվարկված թեստային վիճակագրության արժեքը համապատասխանում է p = 0,005, սա ցույց է տալիս վարկածի ճշմարիտ լինելու 0,5% հավանականությունը: Այսպիսով, որքան փոքր է p-արժեքը, այնքան լավ, քանի որ այն մեծացնում է զրոյական վարկածը մերժելու «ուժը» և մեծացնում արդյունքի ակնկալվող նշանակությունը։

Այս մասին հետաքրքիր բացատրություն կա Habré-ում:

Վիճակագրական վերլուծությունը սկսում է սև արկղի տեսք ունենալ. մուտքագրումը տվյալներ են, ելքը՝ հիմնական արդյունքների աղյուսակ և p-արժեք:

Ի՞նչ է ասում p-արժեքը:

Ենթադրենք, մենք որոշեցինք պարզել, թե արդյոք կապ կա արյունոտ համակարգչային խաղերից կախվածության և իրական կյանքում ագրեսիվության միջև: Դրա համար պատահականության սկզբունքով ձևավորվել է դպրոցականների երկու խումբ՝ յուրաքանչյուրը 100 հոգուց (1-ին խումբ՝ հրաձիգ երկրպագուներ, 2-րդ խումբ՝ համակարգչային խաղեր չխաղացող)։ Օրինակ, հասակակիցների հետ կռիվների քանակը գործում է որպես ագրեսիվության ցուցիչ: Մեր երևակայական ուսումնասիրության մեջ պարզվեց, որ դպրոցական-խաղամոլների խումբը նկատելիորեն ավելի հաճախ է կոնֆլիկտում իր ընկերների հետ։ Բայց ինչպե՞ս պարզենք, թե որքանով են վիճակագրորեն նշանակալից ստացված տարբերությունները: Միգուցե մենք բոլորովին պատահաբար ստացանք նկատված տարբերությունը։ Այս հարցերին պատասխանելու համար օգտագործվում է p-արժեքը. սա նման կամ ավելի ընդգծված տարբերություններ ստանալու հավանականությունն է, պայմանով, որ ընդհանուր բնակչության մեջ իրականում տարբերություններ չկան: Այսինքն, սա մեր խմբերի միջև նման կամ նույնիսկ ավելի ուժեղ տարբերություններ ստանալու հավանականությունն է, պայմանով, որ, ըստ էության, համակարգչային խաղերը որևէ կերպ չազդեն ագրեսիվության վրա։ Դա այնքան էլ դժվար չի հնչում: Այնուամենայնիվ, այս կոնկրետ վիճակագրությունը հաճախ սխալ է մեկնաբանվում:

p-արժեքի օրինակներ

Այսպիսով, մենք համեմատեցինք դպրոցականների երկու խմբերը միմյանց հետ ագրեսիվության մակարդակի առումով՝ օգտագործելով ստանդարտ t-թեստի (կամ ոչ պարամետրային Chi թեստը՝ այս իրավիճակում ավելի նպատակահարմարի քառակուսին) և պարզեցինք, որ բաղձալի p- նշանակության մակարդակը 0,05-ից պակաս է (օրինակ՝ 0,04): Բայց ի՞նչ է մեզ իրականում ասում ստացված p-նշանակության արժեքը: Այսպիսով, եթե p-արժեքը նման կամ ավելի ընդգծված տարբերություններ ստանալու հավանականությունն է, պայմանով, որ իրականում տարբերություններ չկան ընդհանուր բնակչության մեջ, ապա ձեր կարծիքով ո՞րն է ճիշտ պնդումը.

1. Համակարգչային խաղերը 96% հավանականությամբ ագրեսիվ պահվածքի պատճառ են հանդիսանում։
2. Ագրեսիվության և համակարգչային խաղերի միջև կապ չունենալու հավանականությունը 0,04 է։
3. Եթե մենք ստանանք 0,05-ից մեծ նշանակության p-մակարդակ, դա կնշանակի, որ ագրեսիվությունն ու համակարգչային խաղերը ոչ մի կերպ կապված չեն:
4. Պատահական նման տարբերություններ ստանալու հավանականությունը 0,04 է։
5. Բոլոր հայտարարությունները սխալ են:

Եթե ​​ընտրել եք հինգերորդ տարբերակը, ապա միանգամայն իրավացի եք։ Սակայն, ինչպես ցույց են տալիս բազմաթիվ հետազոտություններ, նույնիսկ տվյալների վերլուծության մեջ զգալի փորձ ունեցող մարդիկ հաճախ սխալ են մեկնաբանում p-արժեքները:

Եկեք յուրաքանչյուր պատասխան վերցնենք հերթականությամբ.

Առաջին հայտարարությունը հարաբերակցության սխալի օրինակ է. այն փաստը, որ երկու փոփոխականները զգալիորեն կապված են, մեզ ոչինչ չի ասում պատճառի և հետևանքի մասին: Գուցե ավելի ագրեսիվ մարդիկ են, ովքեր նախընտրում են ժամանակ տրամադրել համակարգչային խաղերին, և համակարգչային խաղերը չեն, որ մարդկանց ավելի ագրեսիվ են դարձնում:

Սա ավելի հետաքրքիր հայտարարություն է։ Բանն այն է, որ մենք ի սկզբանե ընդունում ենք, որ տարբերություններ իսկապես չկան։ Եվ սա նկատի ունենալով որպես փաստ՝ մենք հաշվարկում ենք p արժեքը։ Հետևաբար, ճիշտ մեկնաբանությունը հետևյալն է. «Ենթադրենք, որ ագրեսիվությունն ու համակարգչային խաղերը որևէ կերպ կապված չեն, ապա նման կամ նույնիսկ ավելի ընդգծված տարբերություններ ստանալու հավանականությունը 0,04 էր»։

Բայց ի՞նչ, եթե մենք չնչին տարբերություններ ունենանք: Արդյո՞ք սա նշանակում է, որ ուսումնասիրված փոփոխականների միջև կապ չկա: Ոչ, դա միայն նշանակում է, որ կարող են լինել տարբերություններ, բայց մեր արդյունքները թույլ չեն տվել բացահայտել դրանք։

Սա ուղղակիորեն կապված է հենց p-արժեքի սահմանման հետ: 0,04-ը այս կամ նույնիսկ ավելի ծայրահեղ տարբերությունները ստանալու հավանականությունն է: Սկզբունքորեն, անհնար է գնահատել հենց այնպիսի տարբերություններ ստանալու հավանականությունը, ինչպիսին մեր փորձի ժամանակ:

Սրանք այն թակարդներն են, որոնք կարող են թաքնված լինել այնպիսի ցուցանիշի մեկնաբանման մեջ, ինչպիսին p-արժեքն է: Ուստի շատ կարևոր է հասկանալ հիմնական վիճակագրական ցուցանիշների վերլուծության և հաշվարկման մեթոդների հիմքում ընկած մեխանիզմները:

Ինչպե՞ս գտնել p-արժեքը:

1. Որոշեք ձեր փորձի ակնկալվող արդյունքները

Սովորաբար, երբ գիտնականները փորձարկում են անում, նրանք արդեն պատկերացում ունեն, թե ինչ արդյունքներ պետք է համարեն «նորմալ» կամ «տիպիկ»: Սա կարող է հիմնված լինել անցյալ փորձերի փորձարարական արդյունքների վրա, հուսալի տվյալների հավաքածուների, գիտական ​​գրականության տվյալների վրա կամ գիտնականը կարող է հիմնված լինել որոշ այլ աղբյուրների վրա: Ձեր փորձի համար սահմանեք ակնկալվող արդյունքները և արտահայտեք դրանք թվերով:

Օրինակ. Օրինակ՝ ավելի վաղ ուսումնասիրությունները ցույց են տվել, որ ձեր երկրում կարմիր մեքենաներն ավելի հավանական է, որ արագության տոմսեր ստանան, քան կապույտ մեքենաները: Օրինակ, միջին միավորները ցույց են տալիս 2:1 նախընտրություն կարմիր մեքենաներին, քան կապույտներին: Մենք ցանկանում ենք պարզել, թե արդյոք ոստիկանությունը նույն նախապաշարմունքն ունի ձեր քաղաքում մեքենաների գույնի նկատմամբ: Դրա համար մենք կվերլուծենք արագության գերազանցման համար տրված տուգանքները։ Եթե ​​վերցնենք պատահական 150 տոմսեր, որոնք տրված են կարմիր կամ կապույտ մեքենաներին, ապա մենք ակնկալում ենք, որ 100 տոմս կտրվի կարմիր մեքենաներին և 50-ը կապույտ, եթե մեր քաղաքում ոստիկանությունը նույնքան կողմնակալ է մեքենաների գույնի նկատմամբ, որքան նկատվում է: ողջ երկրում։

2. Որոշեք ձեր փորձի դիտելի արդյունքները

Այժմ, երբ դուք որոշել եք ակնկալվող արդյունքները, դուք պետք է փորձարկեք և գտնեք իրական (կամ «դիտարկված») արժեքները: Դուք կրկին պետք է այս արդյունքները ներկայացնեք որպես թվեր: Եթե ​​մենք ստեղծենք փորձարարական պայմաններ, և դիտարկված արդյունքները տարբերվեն սպասվածից, ապա մենք ունենք երկու հնարավորություն՝ կա՛մ դա պատահաբար է տեղի ունեցել, կա՛մ դա պայմանավորված է հենց մեր փորձով։ p-արժեքը գտնելու նպատակն է հենց պարզել, թե արդյոք դիտարկված արդյունքները տարբերվում են ակնկալվողներից այնպես, որ չի կարելի մերժել «զրոյական հիպոթեզը»՝ այն վարկածը, որ փորձարարական փոփոխականների և դիտարկվածի միջև կապ չկա: արդյունքները։

Օրինակ. Օրինակ՝ մեր քաղաքում մենք պատահականության սկզբունքով ընտրել ենք արագության գերազանցման 150 տոմս, որոնք տրվել են կամ կարմիր կամ կապույտ մեքենաներին: Որոշեցինք, որ 90 տոմս է տրվել կարմիր մեքենաներին, 60-ը՝ կապույտ։ Սա տարբերվում է ակնկալվող արդյունքներից, որոնք համապատասխանաբար կազմում են 100 և 50: Արդյո՞ք մեր փորձը (այս դեպքում՝ տվյալների աղբյուրը ազգայինից քաղաքայինի փոխելը) տվել է արդյունքների այս փոփոխությունը, թե՞ մեր քաղաքային ոստիկանությունը կողմնակալ է ճիշտ նույն կերպ, ինչ ազգային միջինը, և մենք պարզապես պատահական փոփոխություն ենք տեսնում: p-արժեքը կօգնի մեզ որոշել սա:

3. Որոշեք ձեր փորձի ազատության աստիճանների թիվը

Ազատության աստիճանների թիվը ձեր փորձի փոփոխականության աստիճանն է, որը որոշվում է ձեր ուսումնասիրած կատեգորիաների քանակով: Ազատության աստիճանների թվի հավասարումը Ազատության աստիճանների քանակն է = n-1, որտեղ «n»-ը կատեգորիաների կամ փոփոխականների քանակն է, որոնք դուք վերլուծում եք ձեր փորձի ժամանակ:

Օրինակ․ Մեր փորձի արդյունքների երկու կատեգորիա կա՝ մեկ կատեգորիա կարմիր մեքենաների համար և մեկը՝ կապույտ մեքենաների համար։ Հետևաբար, մեր փորձի ժամանակ մենք ունենք 2-1 = 1 աստիճան ազատության: Եթե ​​համեմատեինք կարմիր, կապույտ և կանաչ մեքենաները, կունենայինք 2 աստիճան ազատություն և այլն։

4. Համեմատեք ակնկալվող և դիտված արդյունքները՝ օգտագործելով chi-square թեստը

Chi-square-ը (գրված է «x2») թվային արժեք է, որը չափում է փորձի ակնկալվող և դիտարկվող արժեքների տարբերությունը: Chi-square-ի հավասարումը x2 = Σ((o-e)2/e) է, որտեղ «o»-ն դիտվող արժեքն է, իսկ «e»-ն ակնկալվող արժեքն է: Գումարե՛ք տրված հավասարման արդյունքները բոլոր հնարավոր արդյունքների համար (տե՛ս ստորև):

Նշենք, որ այս հավասարումը ներառում է Ս գումարման օպերատորը (sigma): Այլ կերպ ասած, դուք պետք է հաշվարկեք ((|o-e|-.05)2/e) յուրաքանչյուր հնարավոր արդյունքի համար և գումարեք թվերը՝ ստանալով «chi-square» արժեքը: Մեր օրինակում մենք ունենք երկու հնարավոր արդյունք՝ կա՛մ տուգանքը ստացած մեքենան կարմիր է, կա՛մ կապույտ: Այսպիսով, մենք պետք է հաշվենք ((o-e)2/e) երկու անգամ՝ մեկ անգամ կարմիր մեքենաների համար, և մեկ անգամ՝ կապույտ մեքենաների համար:

Օրինակ. Եկեք միացնենք մեր ակնկալվող և դիտարկված արժեքները x2 = Σ((o-e)2/e հավասարման մեջ): Հիշեք, որ գումարման օպերատորի պատճառով մենք պետք է երկու անգամ հաշվենք ((o-e)2/e)՝ մեկ անգամ կարմիր մեքենաների համար և մեկ անգամ՝ կապույտ մեքենաների համար: Մենք այս աշխատանքը կկատարենք հետևյալ կերպ.
x2 = ((90-100)2/100) + (60-50)2/50)
x2 = ((-10)2/100) + (10)2/50)
x2 = (100/100) + (100/50) = 1 + 2 = 3:

5. Ընտրեք նշանակության մակարդակ

Այժմ, երբ մենք գիտենք մեր փորձի ազատության աստիճանների թիվը և գիտենք chi-square թեստի արժեքը, մենք պետք է ևս մեկ բան անենք, նախքան կարողանանք գտնել մեր p արժեքը: Մենք պետք է որոշենք նշանակության մակարդակը։ խոսում պարզ լեզու, նշանակության մակարդակը ցույց է տալիս, թե որքանով ենք մենք վստահ մեր արդյունքների վրա։ Նշանակության ցածր արժեքը համապատասխանում է փոքր հավանականությանը, որ փորձնական արդյունքները ստացվել են պատահականորեն, և հակառակը: Նշանակության մակարդակները գրվում են որպես տասնորդական կոտորակներ (օրինակ՝ 0,01), ինչը համապատասխանում է այն հավանականությանը, որ մենք պատահաբար ստացել ենք փորձարարական արդյունքները (այս դեպքում դրա հավանականությունը 1%) է։

Կոնվենցիայով, գիտնականները սովորաբար իրենց փորձերի նշանակության մակարդակը սահմանում են 0,05 կամ 5%: Սա նշանակում է, որ փորձարարական արդյունքները, որոնք համապատասխանում են նշանակության նման չափանիշին, կարելի է ձեռք բերել միայն 5% հավանականությամբ, զուտ պատահականորեն: Այլ կերպ ասած, 95% հավանականություն կա, որ արդյունքները պայմանավորված են նրանով, թե ինչպես է գիտնականը շահարկել փորձարարական փոփոխականները, և ոչ պատահական: Փորձերի մեծամասնության համար 95% վստահությունը, որ երկու փոփոխականների միջև կապ կա, բավական է, որպեսզի համարենք, որ դրանք «իրոք» կապված են միմյանց հետ:

Օրինակ. Կարմիր և կապույտ մեքենաների մեր օրինակի համար եկեք հետևենք գիտնականների միջև եղած պայմանին և նշանակության մակարդակը սահմանենք 0,05:

6. Օգտագործեք chi-squared բաշխման տվյալների թերթիկ՝ ձեր p-արժեքը գտնելու համար

Գիտնականներն ու վիճակագիրներն օգտագործում են մեծ աղյուսակներ՝ իրենց փորձերի p արժեքը հաշվարկելու համար: Աղյուսակային տվյալները սովորաբար ունենում են ձախ կողմում ուղղահայաց առանցք, որը համապատասխանում է ազատության աստիճանների թվին, իսկ վերևում՝ հորիզոնական առանցք, որը համապատասխանում է p արժեքին: Օգտագործեք աղյուսակի տվյալները՝ նախ գտնելու ձեր ազատության աստիճանների թիվը, այնուհետև նայեք ձեր շարքը ձախից աջ, մինչև որ գտնեք առաջին արժեքը, որն ավելի մեծ է ձեր «chi-square»-ի արժեքից: Նայեք համապատասխան p-արժեքին ձեր սյունակի վերևում: Ձեր p-արժեքը գտնվում է այս թվի և հաջորդի միջև (ձեր ձախ կողմում գտնվող մեկը):

Chi-squared բաշխման աղյուսակները կարելի է ձեռք բերել բազմաթիվ աղբյուրներից (այստեղ կարող եք գտնել մեկին այս հղումով):

Օրինակ. Մեր chi-square արժեքը 3 էր: Քանի որ մենք գիտենք, որ մեր փորձի մեջ կա ազատության ընդամենը 1 աստիճան, մենք կընտրենք հենց առաջին տողը: Այս գծի երկայնքով մենք գնում ենք ձախից աջ, մինչև որ հանդիպենք 3-ից մեծ արժեքի՝ մեր chi-square թեստի արժեքին: Առաջինը, որ մենք գտնում ենք, 3.84 է: Փնտրելով մեր սյունակը, մենք տեսնում ենք, որ համապատասխան p-արժեքը 0,05 է: Սա նշանակում է, որ մեր p-արժեքը գտնվում է 0,05-ից 0,1-ի միջև (աղյուսակի հաջորդ ամենաբարձր p-արժեքը):

7. Որոշեք՝ մերժե՞լ, թե՞ պահպանել ձեր զրոյական վարկածը

Քանի որ դուք որոշել եք ձեր փորձի մոտավոր p արժեքը, դուք պետք է որոշեք՝ մերժե՞լ ձեր փորձի զրոյական վարկածը, թե՞ ոչ (հիշեք, սա այն վարկածն է, որ ձեր կողմից շահարկված փորձարարական փոփոխականները չեն ազդել ձեր դիտարկած արդյունքների վրա): Եթե ​​ձեր p-արժեքը փոքր է ձեր նշանակության մակարդակից, շնորհավորում եմ, դուք ապացուցել եք, որ շատ հավանական հարաբերություն կա ձեր կողմից շահարկված փոփոխականների և ձեր դիտարկած արդյունքների միջև: Եթե ​​ձեր p-արժեքը ավելի բարձր է, քան ձեր նշանակության մակարդակը, դուք չեք կարող վստահ լինել, արդյոք ձեր դիտարկած արդյունքները պայմանավորված են եղել զուտ պատահականությամբ կամ ձեր փոփոխականների մանիպուլյացիայով:

Օրինակ. Մեր p-արժեքը գտնվում է 0,05-ից 0,1-ի միջև: Սա ակնհայտորեն 0,05-ից ոչ պակաս է, ուստի, ցավոք, մենք չենք կարող մերժել մեր զրոյական վարկածը: Սա նշանակում է, որ մենք չենք հասել նվազագույնը 95 տոկոս հավանականության՝ ասելու, որ մեր քաղաքում ոստիկանությունը կարմիր և կապույտ մեքենաների տոմսեր է տալիս հանրապետական ​​միջինից բավականին տարբեր հավանականությամբ։

Այսինքն՝ 5-10% հավանականություն կա, որ մեր դիտարկած արդյունքները ոչ թե տեղանքի փոփոխության (քաղաքի, ոչ ամբողջ երկրի վերլուծություն) հետևանք են, այլ ուղղակի պատահար։ Քանի որ մենք պահանջում էինք 5%-ից պակաս ճշգրտություն, մենք չենք կարող ասել, որ վստահ ենք, որ մեր քաղաքում ոստիկանությունը ավելի քիչ կողմնակալ է կարմիր մեքենաների նկատմամբ. կա մի փոքր (բայց վիճակագրորեն նշանակալի) հավանականությունը, որ դա այդպես չէ:

Հոգեբանության կուրսային, դիպլոմային և մագիստրոսական թեզերի վիճակագրական հաշվարկների արդյունքների աղյուսակներում միշտ առկա է «p» ցուցանիշը։

Օրինակ՝ համաձայն հետազոտական ​​նպատակներըՀաշվարկվել են պատանեկության տղաների և աղջիկների կյանքի իմաստավորման մակարդակի տարբերությունները:

Նկատի ունեմ

Mann-Whitney U թեստ

Վիճակագրական նշանակության մակարդակ (p)

Տղաներ (20 հոգի)

Աղջիկները

(5 հոգի)

Նպատակներ

28,9

35,2

17,5

0,027*

Գործընթացը

30,1

32,0

38,5

0,435

Արդյունք

25,2

29,0

29,5

0,164

Վերահսկողության վայր - «Ես»

20,3

23,6

0,067

Վերահսկողության վայր - «Կյանք»

30,4

33,8

27,5

0,126

Կյանքի իմաստալիցություն

98,9

111,2

0,103

* - տարբերությունները վիճակագրորեն նշանակալի են (էջ0,05)

Աջ սյունակը ցույց է տալիս «p»-ի արժեքը, և հենց դրա արժեքով կարելի է որոշել՝ տղաների և աղջիկների մոտ ապագայում կյանքի իմաստային տարբերությունները նշանակալի են, թե ոչ: Կանոնը պարզ է.

  • Եթե ​​«p» վիճակագրական նշանակության մակարդակը փոքր է կամ հավասար է 0,05-ին, ապա եզրակացնում ենք, որ տարբերությունները նշանակալի են։ Վերոնշյալ աղյուսակում տղաների և աղջիկների միջև տարբերությունները զգալի են «Նպատակներ»՝ ապագայում կյանքի իմաստալիցություն ցուցիչի նկատմամբ։ Աղջիկների մոտ այս ցուցանիշը վիճակագրորեն զգալիորեն ավելի բարձր է, քան տղաների մոտ։
  • Եթե ​​«p» վիճակագրական նշանակության մակարդակը մեծ է 0,05-ից, ապա եզրակացվում է, որ տարբերությունները էական չեն։ Վերոնշյալ աղյուսակում տղաների և աղջիկների միջև տարբերությունները էական չեն մնացած բոլոր ցուցանիշների համար, բացառությամբ առաջինի։

Որտեղի՞ց է ստացվում «p» վիճակագրական նշանակության մակարդակը

Հաշվարկված է վիճակագրական նշանակության մակարդակը վիճակագրական ծրագիրվիճակագրական չափանիշի հաշվարկի հետ միասին։ Այս ծրագրերում կարող եք նաև սահմանել վիճակագրական նշանակության մակարդակի կրիտիկական սահման, և համապատասխան ցուցանիշները կնշվեն ծրագրի կողմից։

Օրինակ՝ STATISTICA ծրագրում հարաբերակցությունները հաշվարկելիս կարող եք p սահմանաչափը դնել, օրինակ՝ 0,05, և բոլոր վիճակագրական նշանակալի հարաբերությունները կնշվեն կարմիրով։

Եթե ​​վիճակագրական չափանիշի հաշվարկն իրականացվում է ձեռքով, ապա «p» նշանակալիության մակարդակը որոշվում է ստացված չափանիշի արժեքը կրիտիկական արժեքի հետ համեմատելով։

Ի՞նչ է ցույց տալիս «p» վիճակագրական նշանակության մակարդակը

Բոլոր վիճակագրական հաշվարկները մոտավոր են։ Այս մոտարկման մակարդակը որոշում է «r»-ը: Նշանակության մակարդակը գրվում է տասնորդականների տեսքով, օրինակ՝ 0,023 կամ 0,965։ Եթե ​​այս թիվը բազմապատկենք 100-ով, ապա կստանանք p ցուցանիշը որպես տոկոս՝ 2,3% և 96,5%։ Այս տոկոսներն արտացոլում են այն հավանականությունը, որ մեր ենթադրությունը հարաբերությունների, օրինակ՝ ագրեսիվության և անհանգստության միջև, սխալ է:

Այն է, հարաբերակցության գործակիցը 0,58 ագրեսիվության և անհանգստության միջև ստացվում է 0,05 վիճակագրական նշանակության մակարդակով կամ 5% սխալի հավանականությամբ: Սա կոնկրետ ի՞նչ է նշանակում:

Մեր գտած հարաբերակցությունը նշանակում է, որ մեր ընտրանքում նկատվում է հետևյալ օրինաչափությունը՝ որքան բարձր է ագրեսիվությունը, այնքան բարձր է անհանգստությունը։ Այսինքն՝ եթե վերցնենք երկու դեռահասի, և նրանցից մեկը մյուսից ավելի բարձր անհանգստություն կունենա, ապա, իմանալով դրական հարաբերակցության մասին, կարող ենք ասել, որ այս դեռահասը նույնպես կունենա ավելի բարձր ագրեսիվություն։ Բայց քանի որ վիճակագրության մեջ ամեն ինչ մոտավոր է, ուրեմն, սա ասելով, ընդունում ենք, որ կարող ենք սխալվել, իսկ սխալի հավանականությունը 5% է։ Այսինքն՝ դեռահասների այս խմբում կատարելով 20 նման համեմատություն՝ մենք կարող ենք սխալվել մեկ անգամ ագրեսիվության աստիճանի մասին կանխատեսումով՝ իմանալով անհանգստությունը։

Վիճակագրական նշանակության ո՞ր մակարդակն է ավելի լավ՝ 0,01 թե 0,05

Վիճակագրական նշանակության մակարդակն արտացոլում է սխալի հավանականությունը: Հետևաբար, p=0.01-ի արդյունքն ավելի ճշգրիտ է, քան p=0.05-ում:

Հոգեբանական հետազոտություններում ընդունված են արդյունքների վիճակագրական նշանակության երկու ընդունելի մակարդակ.

p=0.01 - արդյունքի բարձր հուսալիություն համեմատական ​​վերլուծությունկամ հարաբերությունների վերլուծություն;

p=0.05 - բավարար ճշգրտություն:

Հուսով եմ, որ այս հոդվածը կօգնի ձեզ ինքնուրույն գրել հոգեբանական աշխատանք: Եթե ​​օգնության կարիք ունեք, խնդրում ենք կապվել (հոգեբանության բոլոր տեսակի աշխատանքներ. վիճակագրական հաշվարկներ):