გამოთვლები
როგორ გამოვთვალოთ სტატისტიკური მნიშვნელოვნების დონე. ახსენით რა არის სტატისტიკური მნიშვნელოვნების დონე

როგორ გამოვთვალოთ სტატისტიკური მნიშვნელოვნების დონე. ახსენით რა არის სტატისტიკური მნიშვნელოვნების დონე

გაზომვების სერიით განსაზღვრული ნიმუშის განაწილების პარამეტრები არის შემთხვევითი ცვლადები, შესაბამისად, მათი გადახრები ზოგადი პარამეტრებიდან ასევე შემთხვევითი იქნება. ამ გადახრების შეფასებას ალბათობითი ხასიათი აქვს - სტატისტიკურ ანალიზში შეიძლება მხოლოდ კონკრეტული შეცდომის ალბათობის მითითება.

მოდით ზოგადი პარამეტრისთვის ამიღებული გამოცდილებიდან მიუკერძოებელი შეფასებით ა*. ჩვენ ვანიჭებთ საკმარისად დიდ ალბათობას b (ისეთი, რომ მოვლენა b ალბათობით შეიძლება ჩაითვალოს პრაქტიკულად გარკვეულად) და ვპოულობთ ასეთ მნიშვნელობას e b = ვ(ბ) რისთვისაც

შეცდომის პრაქტიკულად შესაძლო მნიშვნელობების დიაპაზონი, რომელიც ხდება ჩანაცვლებისას აზე ა* , იქნება ±e b . შეცდომები, რომლებიც დიდია აბსოლუტური მნიშვნელობით, გამოჩნდება მხოლოდ მცირე ალბათობით.

დაურეკა მნიშვნელობის დონე. წინააღმდეგ შემთხვევაში, გამოხატულება (4.1) შეიძლება განიმარტოს, როგორც პარამეტრის ჭეშმარიტი მნიშვნელობის ალბათობა აშიგნით დევს

. (4.3)

ალბათობა b ეწოდება თავდაჯერებულობის დონედა ახასიათებს მიღებული შეფასების სანდოობას. ინტერვალი მე b= ა* ± e b ეწოდება ნდობის ინტერვალი. ინტერვალის საზღვრები ა¢ = ა* - ე ბ და ა¢¢ = ა* + e b ეწოდება ნდობის საზღვრები. ნდობის ინტერვალი მოცემულ ნდობის დონეზე განსაზღვრავს შეფასების სიზუსტეს. ნდობის ინტერვალის მნიშვნელობა დამოკიდებულია ნდობის დონეზე, რომლითაც გარანტირებულია პარამეტრის პოვნა ანდობის ინტერვალის შიგნით: რაც უფრო დიდია b-ის მნიშვნელობა, მით უფრო დიდია ინტერვალი მე b (და მნიშვნელობა e b). ექსპერიმენტების რაოდენობის ზრდა გამოიხატება ნდობის ინტერვალის შემცირებით მუდმივი ნდობის ალბათობით ან ნდობის ალბათობის ზრდით ნდობის ინტერვალის შენარჩუნებით.

პრაქტიკაში ჩვეულებრივ აფიქსირებს ნდობის ალბათობის მნიშვნელობას (0.9; 0.95 ან 0.99) და შემდეგ ადგენს შედეგის ნდობის ინტერვალს. მებ. ნდობის ინტერვალის აგებისას წყდება აბსოლუტური გადახრის პრობლემა:

ამგვარად, თუ ცნობილი იყო შეფასების განაწილების კანონი ა* ნდობის ინტერვალის განსაზღვრის პრობლემა უბრალოდ გადაიჭრებოდა. განვიხილოთ ნდობის ინტერვალის აგება ნორმალურად განაწილებული შემთხვევითი ცვლადის მათემატიკური მოლოდინისთვის Xცნობილი ზოგადი სტანდარტით, ნიმუშის ზომაზე მეტი ნ. საუკეთესო ზღვარი მოლოდინისთვის მარის ნიმუშის საშუალო საშუალო სტანდარტული გადახრით

ლაპლასის ფუნქციის გამოყენებით ვიღებთ

. (4.5)

b ნდობის ალბათობის გათვალისწინებით, ჩვენ ვადგენთ მნიშვნელობას ლაპლასის ფუნქციის ცხრილიდან (დანართი 1) . შემდეგ ფორმას იღებს მათემატიკური მოლოდინის ნდობის ინტერვალი

. (4.7)

(4.7)-დან ჩანს, რომ ნდობის ინტერვალის შემცირება უკუპროპორციულია ექსპერიმენტების რაოდენობის კვადრატული ფესვისა.

ზოგადი დისპერსიის ცოდნა საშუალებას გვაძლევს შევაფასოთ მათემატიკური მოლოდინი თუნდაც ერთი დაკვირვებისთვის. თუ ნორმალურად განაწილებული შემთხვევითი ცვლადისთვის Xექსპერიმენტის შედეგად ღირებულება X 1, მაშინ არჩეული b-სთვის მათემატიკური მოლოდინის ნდობის ინტერვალი აქვს ფორმა

სადაც უ 1-გვ/2 - სტანდარტული ნორმალური განაწილების კვანტილი (დანართი 2).

ქულების განაწილების კანონი ა* დამოკიდებულია რაოდენობის განაწილების კანონზე Xდა, კერძოდ, თავად პარამეტრზე ა. ამ სირთულის გადასაჭრელად მათემატიკურ სტატისტიკაში ორი მეთოდი გამოიყენება:

1) მიახლოებითი - ზე ნ³ 50 შეცვალოს უცნობი პარამეტრები გამოსახულებაში e b მათი შეფასებით, მაგალითად:

2) შემთხვევითი ცვლადიდან ა* გადადით სხვა შემთხვევით ცვლადზე Q * , რომლის განაწილების კანონი არ არის დამოკიდებული სავარაუდო პარამეტრზე ა, მაგრამ დამოკიდებულია მხოლოდ ნიმუშის ზომაზე. ნდა რაოდენობის განაწილების კანონის შესახებ X. ამ ტიპის რაოდენობები ყველაზე დეტალურად იქნა შესწავლილი შემთხვევითი ცვლადების ნორმალური განაწილებისთვის. სიმეტრიული კვანტილები ჩვეულებრივ გამოიყენება Q¢ და Q¢¢ ნდობის ლიმიტებად

, (4.9)

ან (4.2) გათვალისწინებით

. (4.10)

4.2. სტატისტიკური ჰიპოთეზების ტესტირება, მნიშვნელობის ტესტები,

პირველი და მეორე ტიპის შეცდომები.

ქვეშ სტატისტიკური ჰიპოთეზებიგასაგებია ზოგიერთი დაშვება ამა თუ იმ შემთხვევითი ცვლადის საერთო პოპულაციის განაწილების შესახებ. ჰიპოთეზის ტესტირება გაგებულია, როგორც ზოგიერთი სტატისტიკური ინდიკატორის შედარება, გადამოწმების კრიტერიუმები (მნიშვნელობის კრიტერიუმები) გამოითვლება ნიმუშიდან, მათი მნიშვნელობებით განისაზღვრება იმ ვარაუდით, რომ მოცემული ჰიპოთეზა არის ჭეშმარიტი. ჰიპოთეზების ტესტირებისას, ჩვეულებრივ, გარკვეული ჰიპოთეზის შემოწმება ხდება. ჰ 0 ალტერნატიულ ჰიპოთეზასთან შედარებით ჰ 1 .

იმისათვის, რომ გადაწყვიტოთ, მივიღოთ თუ უარვყოთ ჰიპოთეზა, მოცემულია მნიშვნელობის დონე რ. ყველაზე ხშირად გამოყენებული მნიშვნელოვნების დონეებია 0.10, 0.05 და 0.01. ამ ალბათობის მიხედვით, ჰიპოთეზის გამოყენებით შეფასების Q * (მნიშვნელობის კრიტერიუმი) განაწილების შესახებ, მოიძებნება რაოდენობრივი ნდობის ლიმიტები, როგორც წესი, სიმეტრიული Q. გვ/2 და Q 1- გვ/2. Q ნომრები გვ/2 და Q 1- გვ/2 ეძახიან ჰიპოთეზის კრიტიკული მნიშვნელობები; Q მნიშვნელობები *< Qგვ/2 და Q * > Q 1- გვ/2 ქმნიან კრიტიკულს

ჰიპოთეზის ფართობი (ან ჰიპოთეზის მიუღებლობის არეალი) (ნახ. 12).

ბრინჯი. 12.კრიტიკული ზონა ბრინჯი. 13.სტატისტიკის შემოწმება

ჰიპოთეზები. ჰიპოთეზები.

თუ ნიმუშში ნაპოვნი Q 0 ხვდება Q-ს შორის გვ/2 და Q 1- გვ/2, მაშინ ჰიპოთეზა აღიარებს ასეთ მნიშვნელობას, როგორც შემთხვევითობას და, შესაბამისად, არ არსებობს მისი უარყოფის საფუძველი. თუ Q 0-ის მნიშვნელობა მოხვდება კრიტიკულ რეგიონში, მაშინ ამ ჰიპოთეზის მიხედვით, ეს პრაქტიკულად შეუძლებელია. მაგრამ მას შემდეგ რაც გამოჩნდა, ჰიპოთეზა თავად უარყოფილია.

არსებობს ორი ტიპის შეცდომა, რომელიც შეიძლება დაუშვას ჰიპოთეზების ტესტირებისას. I ტიპის შეცდომაარის ის უარყოფს ჰიპოთეზას, რომელიც რეალურად შეესაბამება სიმართლეს. ასეთი შეცდომის ალბათობა არ აღემატება მნიშვნელობის მიღებულ დონეს. II ტიპის შეცდომაარის ის ჰიპოთეზა მიღებულია, მაგრამ სინამდვილეში ის მცდარია. ამ შეცდომის ალბათობა რაც უფრო დაბალია, მით უფრო მაღალია მნიშვნელობის დონე, რადგან ეს ზრდის უარყოფილი ჰიპოთეზების რაოდენობას. თუ მეორე სახის შეცდომის ალბათობა არის a, მაშინ მნიშვნელობა (1 - ა) იწოდება კრიტერიუმის ძალა.

ნახ. 13 გვიჩვენებს Q შემთხვევითი ცვლადის განაწილების სიმკვრივის ორ მრუდს, რომელიც შეესაბამება ორ ჰიპოთეზას ჰ 0 და ჰერთი . თუ გამოცდილებიდან მიღებული მნიშვნელობა არის Q > Q გვ, მაშინ ჰიპოთეზა უარყოფილია. ჰ 0 და ჰიპოთეზა მიღებულია ჰ 1 და პირიქით, თუ Q< Qგვ.

ფართობი ალბათობის სიმკვრივის მრუდის ქვეშ, რომელიც შეესაბამება ჰიპოთეზის ნამდვილობას ჰ 0 Q მნიშვნელობის მარჯვნივ გვ, უდრის მნიშვნელოვნების დონეს რ, ანუ პირველი სახის შეცდომის ალბათობა. ფართობი ალბათობის სიმკვრივის მრუდის ქვეშ, რომელიც შეესაბამება ჰიპოთეზის ნამდვილობას ჰ 1 Q-დან მარცხნივ გვ, უდრის მეორე სახის a შეცდომის ალბათობას და Q-ს მარჯვნივ გვ- კრიტერიუმის ძალა (1 - ა). ამრიგად, მით უფრო რ, მით მეტი (1 - ა). ჰიპოთეზის შემოწმებისას, ისინი ცდილობენ ყველა შესაძლო კრიტერიუმიდან აირჩიონ ის, რომელსაც მნიშვნელობის მოცემულ დონეზე აქვს II ტიპის შეცდომის დაბალი ალბათობა..

ჩვეულებრივ, როგორც მნიშვნელობის ოპტიმალური დონე ჰიპოთეზების ტესტირებისას გამოიყენეთ გვ= 0.05, ვინაიდან თუ შემოწმებული ჰიპოთეზა მიღებულია მნიშვნელობის მოცემული დონით, მაშინ ჰიპოთეზა, რა თქმა უნდა, უნდა იყოს აღიარებული ექსპერიმენტულ მონაცემებთან შესაბამისობაში; მეორე მხრივ, მნიშვნელობის ამ დონის გამოყენება არ იძლევა ჰიპოთეზის უარყოფის საფუძველს.

მაგალითად, ნაპოვნია ორი მნიშვნელობა და ზოგიერთი ნიმუშის პარამეტრი, რომელიც შეიძლება ჩაითვალოს ზოგადი პარამეტრების შეფასებად. ა 1 და ა 2. ვარაუდობენ, რომ განსხვავება და არის შემთხვევითი და რომ ზოგადი პარამეტრები ა 1 და ა 2 ერთმანეთის ტოლია, ე.ი. ა 1 = ა 2. ამ ჰიპოთეზას ე.წ null, ან ნულოვანი ჰიპოთეზა. მის შესამოწმებლად, თქვენ უნდა გაარკვიოთ, არის თუ არა შეუსაბამობა და მნიშვნელობას ნულოვანი ჰიპოთეზის მიხედვით. ამისათვის, ჩვეულებრივ, იკვლევს შემთხვევით ცვლადს D = – და ამოწმებს არის თუ არა მისი განსხვავება ნულიდან მნიშვნელოვანი. ზოგჯერ უფრო მოსახერხებელია ღირებულების გათვალისწინება / მისი ერთიანობასთან შედარებით.

ნულოვანი ჰიპოთეზის უარყოფით ისინი იღებენ ალტერნატიულ ჰიპოთეზას, რომელიც ორად იყოფა: > და< . Если одно из этих равенств заведомо невозможно, то альтернативная гипотеза называется ცალმხრივიდა მის შესამოწმებლად გამოიყენეთ ცალმხრივიმნიშვნელობის კრიტერიუმები (განსხვავებით ჩვეულებრივი, ორმხრივი). ამ შემთხვევაში აუცილებელია კრიტიკული რეგიონის მხოლოდ ერთი ნახევრის გათვალისწინება (სურ. 12).

Მაგალითად, რ= 0.05 ორმხრივი კრიტერიუმით, კრიტიკული მნიშვნელობები Q 0.025 და Q 0.975 შეესაბამება, ანუ Q *, რომლებმაც მიიღეს Q * მნიშვნელობები, ითვლება მნიშვნელოვანი (არა შემთხვევითი)< Q 0.025 и Q * >Q 0.975. ცალმხრივი კრიტერიუმით, ამ უტოლობებიდან ერთ-ერთი აშკარად შეუძლებელია (მაგალითად, Q *< Q 0.025) и значимыми будут лишь Q * >Q 0.975. ბოლო უტოლობის ალბათობა არის 0,025 და შესაბამისად მნიშვნელოვნების დონე იქნება 0,025. ამრიგად, თუ ცალმხრივი მნიშვნელოვნების ტესტისთვის გამოყენებული იქნება იგივე კრიტიკული რიცხვები, როგორც ორკუდიანი, ეს მნიშვნელობები შეესაბამება მნიშვნელოვნების დონის ნახევარს.

ჩვეულებრივ, ცალმხრივი ტესტისთვის, მნიშვნელოვნების იგივე დონე აღებულია, რაც ორკუდიანი ტესტისთვის, რადგან ამ პირობებში ორივე ტესტი იძლევა იგივე ტიპის I შეცდომას. ამისათვის, ცალმხრივი ტესტი უნდა იყოს მიღებული ორკუდიანისგან, რომელიც შეესაბამება მიღებულის მნიშვნელობის ორჯერ მეტ დონეს.. ცალმხრივი ტესტისთვის მნიშვნელოვნების დონის შესანარჩუნებლად რ= 0.05, ორმხრივად აუცილებელია აღება რ= 0.10, რომელიც იძლევა კრიტიკულ მნიშვნელობებს Q 0.05 და Q 0.95. აქედან, ცალმხრივი ტესტისთვის, ერთი დარჩება, მაგალითად, Q 0.95. მნიშვნელოვნების დონე ცალმხრივი ტესტისთვის არის 0.05. მნიშვნელოვნების იგივე დონე ორკუდიანი ტესტისთვის შეესაბამება კრიტიკულ მნიშვნელობას Q 0,975. მაგრამ Q 0.95< Q 0.975 , значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода.

სტატისტიკაში მნიშვნელოვნების დონე მნიშვნელოვანი მაჩვენებელია, რომელიც ასახავს მიღებული (პროგნოზირებადი) მონაცემების სიზუსტესა და სიმართლეში ნდობის ხარისხს. კონცეფცია ფართოდ გამოიყენება სხვადასხვა სფეროში: სოციოლოგიური კვლევებიდან მეცნიერული ჰიპოთეზების სტატისტიკური ტესტირებამდე.

განმარტება

სტატისტიკური მნიშვნელოვნების (ან სტატისტიკურად მნიშვნელოვანი შედეგის) დონე გვიჩვენებს, რა არის შესწავლილი ინდიკატორების შემთხვევითი წარმოშობის ალბათობა. ფენომენის საერთო სტატისტიკური მნიშვნელობა გამოიხატება p-მნიშვნელობით (p-დონე). ნებისმიერ ექსპერიმენტსა თუ დაკვირვებაში არის შესაძლებლობა, რომ მიღებული მონაცემები აღმოცენდეს შერჩევის შეცდომების გამო. ეს განსაკუთრებით ეხება სოციოლოგიას.

ანუ, მნიშვნელობა არის სტატისტიკურად მნიშვნელოვანი, რომლის შემთხვევითი წარმოშობის ალბათობა ძალიან მცირეა ან მიდრეკილია უკიდურესობამდე. უკიდურესობა ამ კონტექსტში არის სტატისტიკის გადახრის ხარისხი ნულოვანი ჰიპოთეზიდან (ჰიპოთეზა, რომელიც შემოწმებულია მიღებული ნიმუშის მონაცემებთან შესაბამისობაში). სამეცნიერო პრაქტიკაში მნიშვნელოვნების დონე ირჩევა მონაცემთა შეგროვებამდე და, როგორც წესი, მისი კოეფიციენტია 0,05 (5%). სისტემებისთვის, სადაც ზუსტი მნიშვნელობები კრიტიკულია, ეს შეიძლება იყოს 0.01 (1%) ან ნაკლები.

ფონი

მნიშვნელოვნების დონის კონცეფცია შემოიღო ბრიტანელმა სტატისტიკოსმა და გენეტიკოსმა რონალდ ფიშერმა 1925 წელს, როდესაც ის ავითარებდა სტატისტიკური ჰიპოთეზების ტესტირების ტექნიკას. ნებისმიერი პროცესის გაანალიზებისას არსებობს გარკვეული ფენომენის ალბათობა. სირთულეები წარმოიქმნება ალბათობის მცირე (ან არა აშკარა) პროცენტებთან მუშაობისას, რომლებიც მიეკუთვნება "გაზომვის შეცდომის" კონცეფციას.

სტატისტიკასთან მუშაობისას, რომელიც არ იყო საკმარისად სპეციფიკური შესამოწმებლად, მეცნიერებს დაუპირისპირდნენ ნულოვანი ჰიპოთეზის პრობლემას, რომელიც „აფერხებს“ მცირე მნიშვნელობებით მუშაობას. ფიშერმა შესთავაზა ასეთ სისტემებს, რათა განესაზღვრათ მოვლენების ალბათობა 5% (0.05), როგორც მოხერხებული ნიმუშის წყვეტა, რომელიც საშუალებას იძლევა უარყოს ნულოვანი ჰიპოთეზა გამოთვლებში.

ფიქსირებული კოეფიციენტის შემოღება

1933 წელს იერჟის მეცნიერებინეიმანმა და ეგონ პირსონმა თავიანთ ნაშრომებში რეკომენდაცია გაუწიეს წინასწარ განსაზღვრული მნიშვნელობის დონის განსაზღვრას (მონაცემების შეგროვებამდე). ამ წესების გამოყენების მაგალითები აშკარად ჩანს არჩევნების დროს. დავუშვათ, რომ არსებობს ორი კანდიდატი, რომელთაგან ერთი ძალიან პოპულარულია და მეორე ცნობილი არ არის. აშკარაა, რომ პირველი კანდიდატი გაიმარჯვებს არჩევნებში, ხოლო მეორეს შანსები ნულისკენ მიდის. იბრძოლეთ - მაგრამ არა თანაბარი: ყოველთვის არის ფორსმაჟორების, სენსაციური ინფორმაციის, მოულოდნელი გადაწყვეტილებების შესაძლებლობა, რამაც შეიძლება შეცვალოს არჩევნების პროგნოზირებული შედეგები.

ნოიმანი და პირსონი შეთანხმდნენ, რომ ფიშერის მიერ შემოთავაზებული მნიშვნელოვნების დონე 0,05 (აღნიშნული α სიმბოლოთი) ყველაზე მოსახერხებელია. თუმცა, თავად ფიშერი 1956 წელს ეწინააღმდეგებოდა ამ ღირებულების დაფიქსირებას. მას სჯეროდა, რომ α-ს დონე უნდა განისაზღვროს კონკრეტული გარემოებების შესაბამისად. მაგალითად, ნაწილაკების ფიზიკაში ეს არის 0.01.

p-მნიშვნელობა

ტერმინი p-მნიშვნელობა პირველად გამოიყენა ბრაუნლიმ 1960 წელს. P-დონე (p-მნიშვნელობა) არის ინდიკატორი, რომელიც უკუკავშირშია შედეგების ჭეშმარიტებასთან. უმაღლესი p-მნიშვნელობა შეესაბამება ცვლადებს შორის შერჩეულ ურთიერთობაში ნდობის ყველაზე დაბალ დონეს.

ეს მნიშვნელობა ასახავს შედეგების ინტერპრეტაციასთან დაკავშირებული შეცდომების ალბათობას. დავუშვათ p-მნიშვნელობა = 0.05 (1/20). ეს აჩვენებს ხუთ პროცენტიან შანსს, რომ ნიმუშში ნაპოვნი ცვლადებს შორის კავშირი მხოლოდ ნიმუშის შემთხვევითი მახასიათებელია. ანუ, თუ ეს დამოკიდებულება არ არის, მაშინ განმეორებითი მსგავსი ექსპერიმენტებით, საშუალოდ, ყოველ მეოცე კვლევაში, შეიძლება ველოდოთ იგივე ან უფრო დიდ დამოკიდებულებას ცვლადებს შორის. ხშირად p- დონე განიხილება, როგორც შეცდომის დონის "ზღვარი".

სხვათა შორის, p-მნიშვნელობა შეიძლება არ ასახავდეს რეალურ ურთიერთობას ცვლადებს შორის, მაგრამ მხოლოდ აჩვენებს გარკვეულ საშუალო მნიშვნელობას დაშვებების ფარგლებში. კერძოდ, მონაცემების საბოლოო ანალიზი ასევე დამოკიდებული იქნება ამ კოეფიციენტის არჩეულ მნიშვნელობებზე. p-დონეზე = 0,05 იქნება გარკვეული შედეგი, ხოლო კოეფიციენტით ტოლი 0,01, სხვები.

სტატისტიკური ჰიპოთეზების ტესტირება

ჰიპოთეზების ტესტირებისას განსაკუთრებით მნიშვნელოვანია სტატისტიკური მნიშვნელოვნების დონე. მაგალითად, ორკუდიანი ტესტის გაანგარიშებისას, უარყოფის არე ნაწილდება სინჯის განაწილების ორივე ბოლოზე (ნულოვანი კოორდინატთან მიმართებაში) თანაბრად და გამოითვლება მიღებული მონაცემების ჭეშმარიტება.

დავუშვათ, გარკვეული პროცესის (ფენომენის) მონიტორინგის დროს აღმოჩნდა, რომ ახალი სტატისტიკური ინფორმაცია მიუთითებს მცირე ცვლილებებზე წინა მნიშვნელობებთან მიმართებაში. ამავდროულად, შედეგების შეუსაბამობები მცირეა, არა აშკარა, მაგრამ მნიშვნელოვანია კვლევისთვის. სპეციალისტი დილემის წინაშე დგას: ცვლილებები ნამდვილად ხდება თუ არის შერჩევის შეცდომები (გაზომვის უზუსტობა)?

ამ შემთხვევაში, ნულოვანი ჰიპოთეზა გამოიყენება ან უარყოფილია (ყველაფერი ჩამოიწერება შეცდომის სახით, ან სისტემაში ცვლილება აღიარებულია, როგორც დასრულებული ფაქტი). პრობლემის გადაჭრის პროცესი ეფუძნება საერთო სტატისტიკური მნიშვნელოვნების თანაფარდობას (p-მნიშვნელობა) და მნიშვნელოვნების დონეს (α). თუ p-დონე< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

გამოყენებული ღირებულებები

მნიშვნელოვნების დონე დამოკიდებულია გაანალიზებულ მასალაზე. პრაქტიკაში გამოიყენება შემდეგი ფიქსირებული მნიშვნელობები:

α = 0,1 (ან 10%);
α = 0,05 (ან 5%);
α = 0,01 (ან 1%);
α = 0.001 (ან 0.1%).

რაც უფრო ზუსტია საჭირო გამოთვლები, მით უფრო მცირეა α კოეფიციენტი. ბუნებრივია, სტატისტიკური პროგნოზები ფიზიკაში, ქიმიაში, ფარმაცევტიკასა და გენეტიკაში უფრო მეტ სიზუსტეს მოითხოვს, ვიდრე პოლიტიკურ მეცნიერებასა და სოციოლოგიაში.

მნიშვნელობის ზღურბლები კონკრეტულ სფეროებში

მაღალი სიზუსტის სფეროებში, როგორიცაა ნაწილაკების ფიზიკა და წარმოება, სტატისტიკური მნიშვნელობა ხშირად გამოიხატება როგორც სტანდარტული გადახრის თანაფარდობა (აღნიშნული სიგმა - σ კოეფიციენტით) ნორმალურ ალბათობასთან (გაუსური განაწილება) შედარებით. σ არის სტატისტიკური მაჩვენებელი, რომელიც განსაზღვრავს გარკვეული რაოდენობის მნიშვნელობების გავრცელებას მათემატიკური მოლოდინების მიმართ. გამოიყენება მოვლენების ალბათობის გამოსათვლელად.

ცოდნის სფეროდან გამომდინარე, σ კოეფიციენტი ძალიან განსხვავდება. მაგალითად, ჰიგსის ბოზონის არსებობის პროგნოზირებისას პარამეტრი σ უდრის ხუთს (σ=5), რაც შეესაბამება p-მნიშვნელობას=1/3,5 მლნ ფართობს.

ეფექტურობა

გასათვალისწინებელია, რომ კოეფიციენტები α და p-მნიშვნელობა არ არის ზუსტი მახასიათებლები. როგორიც არ უნდა იყოს მნიშვნელოვნების დონე შესწავლილი ფენომენის სტატისტიკაში, ეს არ არის ჰიპოთეზის მიღების უპირობო საფუძველი. მაგალითად, რაც უფრო მცირეა α-ს მნიშვნელობა, მით მეტია შანსი იმისა, რომ ჰიპოთეზის ჩამოყალიბება მნიშვნელოვანი იყოს. თუმცა, არსებობს შეცდომის რისკი, რაც ამცირებს კვლევის სტატისტიკურ ძალას (მნიშვნელოვნებას).

მკვლევარებმა, რომლებიც ყურადღებას ამახვილებენ ექსკლუზიურად სტატისტიკურად მნიშვნელოვან შედეგებზე, შეიძლება გამოიტანონ მცდარი დასკვნები. ამავდროულად, რთულია მათი მუშაობის ორმაგი შემოწმება, რადგან ისინი იყენებენ ვარაუდებს (რაც, ფაქტობრივად, არის α და p-მნიშვნელობის მნიშვნელობები). ამიტომ ყოველთვის რეკომენდირებულია, სტატისტიკური მნიშვნელობის გამოთვლასთან ერთად, განისაზღვროს კიდევ ერთი მაჩვენებელი - სტატისტიკური ეფექტის სიდიდე. ეფექტის ზომა არის ეფექტის სიძლიერის რაოდენობრივი საზომი.

მნიშვნელობა ეწოდება სტატისტიკურად ღირებულითუ მისი წმინდად შემთხვევითი წარმოშობის ან კიდევ უფრო ექსტრემალური მნიშვნელობების ალბათობა მცირეა. აქ უკიდურესია ნულოვანი ჰიპოთეზისგან გადახრის ხარისხი. განსხვავება ითვლება "სტატისტიკურად მნიშვნელოვანი", თუ არსებობს მონაცემები, რომლებიც ნაკლებად სავარაუდოა, რომ მოხდეს, თუ ვივარაუდებთ, რომ განსხვავება არ არსებობს; ეს გამოთქმა არ ნიშნავს, რომ ეს განსხვავება უნდა იყოს დიდი, მნიშვნელოვანი ან მნიშვნელოვანი ამ სიტყვის ზოგადი გაგებით.

ტესტის მნიშვნელოვნების დონე არის ჰიპოთეზის ტესტირების ტრადიციული ცნება სიხშირის სტატისტიკაში. იგი განისაზღვრება, როგორც ნულოვანი ჰიპოთეზის უარყოფის გადაწყვეტილების მიღების ალბათობა, თუ, ფაქტობრივად, ნულოვანი ჰიპოთეზა არის ჭეშმარიტი (გადაწყვეტილება ცნობილია როგორც I ტიპის შეცდომა, ან ცრუ დადებითი გადაწყვეტილება.) გადაწყვეტილების პროცესი ხშირად ეყრდნობა p- მნიშვნელობას. (წაიკითხეთ „pi-მნიშვნელობა“): თუ p-მნიშვნელობის დონეზე ნაკლებია, მაშინ ნულოვანი ჰიპოთეზა უარყოფილია. რაც უფრო მცირეა p-მნიშვნელობა, მით უფრო მნიშვნელოვანია ტესტის სტატისტიკა. რაც უფრო მცირეა p-მნიშვნელობა, მით უფრო ძლიერია ნულოვანი ჰიპოთეზის უარყოფის მიზეზი.

მნიშვნელობის დონე ჩვეულებრივ აღინიშნება ბერძნული ასო α (ალფა). პოპულარული მნიშვნელობის დონეებია 5%, 1% და 0.1%. თუ ტესტი აწარმოებს p-მნიშვნელობას α-დონეზე ნაკლებს, მაშინ ნულოვანი ჰიპოთეზა უარყოფილია. ასეთ შედეგებს არაფორმალურად მოიხსენიებენ, როგორც "სტატისტიკურად მნიშვნელოვანი". მაგალითად, თუ ვინმე იტყვის, რომ „მოვლენის შანსები არის დამთხვევა ათასში ერთის“, მაშინ გულისხმობს 0,1%-იანი მნიშვნელოვნების დონეს.

α დონის სხვადასხვა მნიშვნელობებს აქვთ თავისი დადებითი და უარყოფითი მხარეები. უფრო მცირე α- დონეები იძლევა უფრო მეტ ნდობას, რომ უკვე ჩამოყალიბებული ალტერნატიული ჰიპოთეზა მნიშვნელოვანია, მაგრამ არსებობს ცრუ ნულოვანი ჰიპოთეზის უარყოფის დიდი რისკი (II ტიპის შეცდომა, ან "ცრუ უარყოფითი გადაწყვეტილება") და, შესაბამისად, ნაკლები სტატისტიკური ძალა. α-დონის არჩევა გარდაუვალად მოითხოვს გაცვლას მნიშვნელობასა და სიმძლავრეს შორის და, შესაბამისად, I და II ტიპის შეცდომის ალბათობებს შორის. შიდაში სამეცნიერო ნაშრომებიხშირად არასწორი ტერმინი „მნიშვნელოვნება“ გამოიყენება ტერმინის „სტატისტიკური მნიშვნელობის“ ნაცვლად.

იხილეთ ასევე

შენიშვნები

ჯორჯ კაზელა, როჯერ ლ. ბერგერიჰიპოთეზის ტესტირება // სტატისტიკური დასკვნა . -Მეორე გამოცემა. - Pacific Grove, CA: Duxbury, 2002. - S. 397. - 660 გვ. - ISBN 0-534-24312-6

ფონდი ვიკიმედია. 2010 წ.

ნახეთ, რა არის "მნიშვნელობის დონე" სხვა ლექსიკონებში:

რიცხვი იმდენად მცირეა, რომ თითქმის დარწმუნებით შეიძლება ჩაითვალოს, რომ α ალბათობით მოვლენა არ მოხდება ერთ ექსპერიმენტში. ჩვეულებრივ U. z. ფიქსირდება თვითნებურად, კერძოდ: 0.05, 0.01 და განსაკუთრებული სიზუსტით 0.005 და ა.შ.გეოლ. მუშაობა…… გეოლოგიური ენციკლოპედია

მნიშვნელობის დონე- სტატისტიკური კრიტერიუმი (მას ასევე უწოდებენ "ალფა დონეს" და აღინიშნება ბერძნული ასოებით) არის I ტიპის შეცდომის ალბათობის ზედა ზღვარი (ნულოვანი ჰიპოთეზის უარყოფის ალბათობა, როდესაც ის რეალურად მართალია). ტიპიური მნიშვნელობებია... სოციოლოგიური სტატისტიკის ლექსიკონი

ინგლისური დონე, მნიშვნელობა; გერმანული Signifikanzniveau. რისკის ხარისხი არის ის, რომ მკვლევარმა შეიძლება გამოიტანოს არასწორი დასკვნა დანამატების, ჰიპოთეზების მცდარობის შესახებ, ნიმუშის მონაცემებზე დაყრდნობით. ანტინაზი. სოციოლოგიის ენციკლოპედია, 2009 ... სოციოლოგიის ენციკლოპედია

მნიშვნელობის დონე- - [L.G. Sumenko. საინფორმაციო ტექნოლოგიების ინგლისური რუსული ლექსიკონი. M .: GP TsNIIS, 2003.] თემები საინფორმაციო ტექნოლოგიები ზოგადად EN დონე მნიშვნელობის ... ტექნიკური მთარგმნელის სახელმძღვანელო

მნიშვნელობის დონე- 3.31 მნიშვნელოვნების დონე α: მოცემული მნიშვნელობა, რომელიც წარმოადგენს სტატისტიკური ჰიპოთეზის უარყოფის ალბათობის ზედა ზღვარს, როდესაც ეს ჰიპოთეზა ჭეშმარიტია. წყარო: GOST R ISO 12491 2011: სამშენებლო მასალები და პროდუქტები. ... ... ნორმატიული და ტექნიკური დოკუმენტაციის ტერმინთა ლექსიკონი-საცნობარო წიგნი

მნიშვნელოვნების დონე- მათემატიკური სტატისტიკის კონცეფცია, რომელიც ასახავს მცდარი დასკვნის ალბათობის ხარისხს მახასიათებლის განაწილების შესახებ სტატისტიკურ ჰიპოთეზასთან დაკავშირებით, დამოწმებული ნიმუშის მონაცემების საფუძველზე. ფსიქოლოგიურ კვლევაში საკმარისი დონისთვის ... ... Თანამედროვე სასწავლო პროცესი: ძირითადი ცნებები და ტერმინები

მნიშვნელობის დონე- reikšmingumo lygis statusas T sritis automatika atitikmenys: ინგლ. მნიშვნელობის დონე vok. Signifikanzniveau, n rus. მნიშვნელობის დონე, m pranc. მნიშვნელოვანი მნიშვნელობა, მ … ავტომატური ტერმინალი

მნიშვნელობის დონე- reikšmingumo lygis statusas T sritis fizika atitikmenys: ინგლ. მნიშვნელობის დონე; მნიშვნელობის დონე vok. Sicherheitsschwelle, f rus. მნიშვნელობის დონე, fpranc. მნიშვნელოვანი მნიშვნელობა, მ … ფიზიკურ ტერმინალში

სტატისტიკური ტესტი, იხილეთ მნიშვნელოვნების დონე... დიდი საბჭოთა ენციკლოპედია

მნიშვნელოვნების დონე- იხილეთ მნიშვნელობა, დონე... ლექსიკონიფსიქოლოგიაში

წიგნები

"Ზე საიდუმლო" . ლუბიანკა - სტალინს ქვეყანაში არსებული მდგომარეობის შესახებ (1922-1934 წწ.). ტომი 4. ნაწილი 1,. ნაშრომების მრავალტომიანი ფუნდამენტური გამოცემა - ინფორმაციის მიმოხილვებიდა OGPU-ს რეზიუმეები - უნიკალურია თავისი სამეცნიერო მნიშვნელობით, ღირებულებით, შინაარსითა და მოცულობით. ამ ისტორიულ…
საგანმანათლებლო პროგრამა, როგორც პროფესიული განათლების ხარისხის მართვის სისტემის ინსტრუმენტი, ტკაჩევა გალინა ვიქტოროვნა, ლოგაჩევი მაქსიმ სერგეევიჩი, სამარინი იური ნიკოლაევიჩი. მონოგრაფიაში გაანალიზებულია პროფესიული საგანმანათლებლო პროგრამების შინაარსის ფორმირების არსებული პრაქტიკა. ადგილი, სტრუქტურა, შინაარსი და მნიშვნელობის დონე განისაზღვრება ...

p-მნიშვნელობა(ინგლ.) - მნიშვნელობა, რომელიც გამოიყენება სტატისტიკური ჰიპოთეზების შემოწმებისას. სინამდვილეში, ეს არის შეცდომის ალბათობა ნულოვანი ჰიპოთეზის უარყოფისას (პირველი სახის შეცდომა). ჰიპოთეზის ტესტირება P-მნიშვნელობის გამოყენებით არის კლასიკური ტესტირების პროცედურის ალტერნატივა განაწილების კრიტიკული მნიშვნელობის მეშვეობით.

ჩვეულებრივ, P-მნიშვნელობა უდრის ალბათობას, რომ შემთხვევითი ცვლადი მოცემული განაწილებით (სატესტო სტატისტიკის განაწილება ნულოვანი ჰიპოთეზის მიხედვით) მიიღებს მნიშვნელობას არანაკლებ ტესტის სტატისტიკის რეალურ მნიშვნელობაზე. ვიკიპედია.

სხვა სიტყვებით რომ ვთქვათ, p-მნიშვნელობა არის მნიშვნელობის უმცირესი დონე (ანუ ჭეშმარიტი ჰიპოთეზის უარყოფის ალბათობა), რომლისთვისაც გამოთვლილი ტესტის სტატისტიკა იწვევს ნულოვანი ჰიპოთეზის უარყოფას. როგორც წესი, p-მნიშვნელობა შედარებულია ზოგადად მიღებულ სტანდარტულ მნიშვნელოვნების დონეებთან 0,005 ან 0,01.

მაგალითად, თუ ნიმუშიდან გამოთვლილი ტესტის სტატისტიკის მნიშვნელობა შეესაბამება p = 0,005, ეს მიუთითებს ჰიპოთეზის ჭეშმარიტების 0,5% ალბათობაზე. ამრიგად, რაც უფრო მცირეა p-მნიშვნელობა, მით უკეთესი, რადგან ის ზრდის ნულოვანი ჰიპოთეზის უარყოფის „სიძლიერეს“ და ზრდის შედეგის მოსალოდნელ მნიშვნელობას.

ამის საინტერესო ახსნა არის ჰაბრეზე.

სტატისტიკური ანალიზი შავ ყუთს ჰგავს: შეყვანა არის მონაცემები, გამომავალი არის ძირითადი შედეგების ცხრილი და p-მნიშვნელობა.

რას ამბობს p-მნიშვნელობა?

დავუშვათ, გადავწყვიტეთ გაგვერკვია, არის თუ არა კავშირი სისხლიან კომპიუტერულ თამაშებზე დამოკიდებულებასა და რეალურ ცხოვრებაში აგრესიულობას შორის. ამისთვის შემთხვევითობის პრინციპით ჩამოყალიბდა სკოლის მოსწავლეთა ორი ჯგუფი თითო 100 კაციანი (ჯგუფი 1 - მსროლელი ფანები, ჯგუფი 2 - არ თამაშობენ კომპიუტერულ თამაშებს). მაგალითად, თანატოლებთან ჩხუბის რაოდენობა აგრესიულობის ინდიკატორად მოქმედებს. ჩვენს წარმოსახვით კვლევაში აღმოჩნდა, რომ სკოლის მოსწავლე-აფერისტთა ჯგუფი შესამჩნევად უფრო ხშირად ეწინააღმდეგებოდა ამხანაგებს. მაგრამ როგორ გავიგოთ, რამდენად სტატისტიკურად მნიშვნელოვანია შედეგად მიღებული განსხვავებები? იქნებ სრულიად შემთხვევით მივიღეთ დაფიქსირებული განსხვავება? ამ კითხვებზე პასუხის გასაცემად გამოიყენება p-მნიშვნელობა - ეს არის ასეთი ან უფრო გამოხატული განსხვავებების მიღების ალბათობა, იმ პირობით, რომ რეალურად არ არსებობს განსხვავებები ზოგადად პოპულაციაში. სხვა სიტყვებით რომ ვთქვათ, ეს არის ჩვენს ჯგუფებს შორის ასეთი ან კიდევ უფრო ძლიერი განსხვავებების მიღების ალბათობა, იმ პირობით, რომ რეალურად კომპიუტერული თამაშები არანაირად არ იმოქმედებს აგრესიულობაზე. არც ისე რთულად ჟღერს. თუმცა, ეს კონკრეტული სტატისტიკა ხშირად არასწორად არის განმარტებული.

p-მნიშვნელობის მაგალითები

ასე რომ, ჩვენ შევადარეთ მოსწავლეთა ორი ჯგუფი ერთმანეთს აგრესიულობის დონის მიხედვით სტანდარტული t-ტესტის გამოყენებით (ან არაპარამეტრული Chi ტესტი - ამ სიტუაციაში უფრო შესაფერისის კვადრატი) და აღმოვაჩინეთ, რომ სასურველი p- მნიშვნელოვნების დონე არის 0,05-ზე ნაკლები (მაგალითად, 0,04). მაგრამ რას გვეუბნება მიღებული p-მნიშვნელობის მნიშვნელობა რეალურად? ასე რომ, თუ p-მნიშვნელობა არის ასეთი ან უფრო გამოხატული განსხვავებების მიღების ალბათობა, იმ პირობით, რომ რეალურად არ არსებობს განსხვავებები ზოგადად პოპულაციაში, თქვენი აზრით, რა არის სწორი განცხადება:

1. კომპიუტერული თამაშები არის აგრესიული ქცევის მიზეზი 96%-იანი ალბათობით.
2. ალბათობა იმისა, რომ აგრესიულობა და კომპიუტერული თამაშები ერთმანეთთან არ არის დაკავშირებული, არის 0,04.
3. თუ მივიღებთ 0,05-ზე მეტი მნიშვნელობის p-დონის, ეს ნიშნავს, რომ აგრესიულობა და კომპიუტერული თამაშები არანაირად არ არის დაკავშირებული.
4. ასეთი სხვაობების შემთხვევით მიღების ალბათობა არის 0,04.
5. ყველა განცხადება არასწორია.

თუ მეხუთე ვარიანტი აირჩიე, მაშინ აბსოლუტურად მართალი ხარ! მაგრამ, როგორც მრავალი კვლევა აჩვენებს, მონაცემთა ანალიზის მნიშვნელოვანი გამოცდილების მქონე ადამიანებიც კი ხშირად არასწორ ინტერპრეტაციას უკეთებენ p-მნიშვნელობებს.

ავიღოთ თითოეული პასუხი თანმიმდევრობით:

პირველი განცხადება არის კორელაციური შეცდომის მაგალითი: ის ფაქტი, რომ ორი ცვლადი მნიშვნელოვნად არის დაკავშირებული, არაფერს გვეუბნება მიზეზსა და შედეგზე. შესაძლოა, ეს უფრო აგრესიული ხალხია, ვინც ამჯობინებს დროის გატარებას კომპიუტერულ თამაშებში და ეს არ არის კომპიუტერული თამაშები, რაც ადამიანებს უფრო აგრესიულს ხდის.

ეს უფრო საინტერესო განცხადებაა. საქმე იმაშია, რომ ჩვენ თავდაპირველად ვთვლით, რომ განსხვავებები ნამდვილად არ არის. და, ამის გათვალისწინებით, როგორც ფაქტი, ჩვენ ვიანგარიშებთ p-მნიშვნელობას. მაშასადამე, სწორი ინტერპრეტაცია ასეთია: „თუ ვივარაუდოთ, რომ აგრესიულობა და კომპიუტერული თამაშები არანაირად არ არის დაკავშირებული, მაშინ ასეთი ან კიდევ უფრო გამოხატული განსხვავებების მიღების ალბათობა იყო 0.04“.

მაგრამ რა მოხდება, თუ ჩვენ მივიღებთ უმნიშვნელო განსხვავებებს? ნიშნავს თუ არა ეს, რომ შესწავლილ ცვლადებს შორის კავშირი არ არის? არა, ეს მხოლოდ იმას ნიშნავს, რომ შეიძლება იყოს განსხვავებები, მაგრამ ჩვენმა შედეგებმა არ მოგვცა მათი გამოვლენის საშუალება.

ეს პირდაპირ კავშირშია თავად p-მნიშვნელობის განმარტებასთან. 0.04 არის ამ ან კიდევ უფრო უკიდურესი განსხვავებების მიღების ალბათობა. პრინციპში, შეუძლებელია ზუსტად ისეთი განსხვავებების მიღების ალბათობის შეფასება, როგორიც ჩვენს ექსპერიმენტში იყო!

ეს არის ის ხარვეზები, რომლებიც შეიძლება დამალული იყოს ისეთი ინდიკატორის ინტერპრეტაციაში, როგორიცაა p-მნიშვნელობა. აქედან გამომდინარე, ძალზე მნიშვნელოვანია ძირითადი სტატისტიკური ინდიკატორების ანალიზისა და გაანგარიშების მეთოდების საფუძველში არსებული მექანიზმების გაგება.

როგორ მოვძებნოთ p-მნიშვნელობა?

1. განსაზღვრეთ თქვენი ექსპერიმენტის მოსალოდნელი შედეგები

ჩვეულებრივ, როდესაც მეცნიერები ატარებენ ექსპერიმენტს, მათ უკვე აქვთ წარმოდგენა იმის შესახებ, თუ რა შედეგები უნდა ჩაითვალოს "ნორმალურად" ან "ტიპიურად". ეს შეიძლება ეფუძნებოდეს წარსული ექსპერიმენტების ექსპერიმენტულ შედეგებს, სანდო მონაცემთა ნაკრებებს, სამეცნიერო ლიტერატურის მონაცემებს, ან მეცნიერი შეიძლება დაფუძნდეს სხვა წყაროებზე. თქვენი ექსპერიმენტისთვის განსაზღვრეთ მოსალოდნელი შედეგები და გამოხატეთ ისინი რიცხვებად.

მაგალითი: მაგალითად, ადრინდელმა კვლევებმა აჩვენა, რომ თქვენს ქვეყანაში წითელი მანქანები უფრო ხშირად იღებენ სიჩქარის ბილეთებს, ვიდრე ლურჯი მანქანები. მაგალითად, საშუალო ქულები აჩვენებენ 2:1 უპირატესობას წითელ მანქანებს ლურჯზე. ჩვენ გვინდა დავადგინოთ, აქვს თუ არა პოლიციას იგივე ცრურწმენა თქვენს ქალაქში მანქანების ფერის მიმართ. ამისათვის გავაანალიზებთ სიჩქარის გადაჭარბების გამო დადგენილ ჯარიმებს. თუ ავიღებთ შემთხვევით კომპლექტს 150 სიჩქარის ბილეთებისგან, რომლებიც გაცემულია წითელ ან ლურჯ მანქანებზე, ჩვენ მოველით, რომ 100 ბილეთი გაიცემა წითელ მანქანებზე და 50 ლურჯზე, თუ ჩვენს ქალაქში პოლიცია ისეთივე მიკერძოებულია მანქანების ფერის მიმართ, როგორც ეს შეინიშნება. მთელი ქვეყნის მასშტაბით.

2. განსაზღვრეთ თქვენი ექსპერიმენტის დაკვირვებადი შედეგები

ახლა, როდესაც დაადგინეთ მოსალოდნელი შედეგები, თქვენ უნდა ჩაატაროთ ექსპერიმენტი და იპოვოთ რეალური (ან „დაკვირვებული“) მნიშვნელობები. თქვენ კვლავ უნდა წარმოადგინოთ ეს შედეგები რიცხვებად. თუ ჩვენ შევქმნით ექსპერიმენტულ პირობებს და დაკვირვებული შედეგები განსხვავდება მოსალოდნელისგან, მაშინ გვაქვს ორი შესაძლებლობა - ან ეს მოხდა შემთხვევით, ან ეს გამოწვეულია ზუსტად ჩვენი ექსპერიმენტით. p-მნიშვნელობის პოვნის მიზანია ზუსტად დადგინდეს, განსხვავდება თუ არა დაკვირვებული შედეგები მოსალოდნელისგან ისე, რომ არ შეიძლება უარვყოთ "ნულის ჰიპოთეზა" - ჰიპოთეზა, რომ არ არსებობს კავშირი ექსპერიმენტულ ცვლადებსა და დაკვირვებულს შორის. შედეგები.

მაგალითი: მაგალითად, ჩვენს ქალაქში, ჩვენ შემთხვევით შევარჩიეთ 150 სიჩქარის გადაჭარბებული ბილეთი, რომლებიც გაიცემა წითელ ან ლურჯ მანქანებზე. ჩვენ დავადგინეთ, რომ 90 ბილეთი გაიცა წითელ მანქანებზე და 60 ლურჯზე. ეს განსხვავდება მოსალოდნელი შედეგებისგან, რომლებიც შესაბამისად არის 100 და 50. მოახდინა თუ არა ჩვენმა ექსპერიმენტმა (ამ შემთხვევაში, მონაცემთა წყაროს შეცვლა ნაციონალურიდან ურბანულზე) შედეგის ამ ცვლილებას, თუ ჩვენი ქალაქის პოლიცია არის მიკერძოებული ზუსტად ისევე, როგორც ეროვნული საშუალო და ჩვენ ვხედავთ მხოლოდ შემთხვევით ცვალებადობას? p-მნიშვნელობა დაგვეხმარება ამის დადგენაში.

3. განსაზღვრეთ თქვენი ექსპერიმენტის თავისუფლების ხარისხების რაოდენობა

თავისუფლების ხარისხი არის თქვენი ექსპერიმენტის ცვალებადობის ხარისხი, რომელიც განისაზღვრება იმ კატეგორიების რაოდენობით, რომელსაც თქვენ იკვლევთ. თავისუფლების გრადუსების რაოდენობის განტოლება არის თავისუფლების გრადუსების რაოდენობა = n-1, სადაც "n" არის კატეგორიების ან ცვლადების რაოდენობა, რომლებსაც აანალიზებთ თქვენს ექსპერიმენტში.

მაგალითი: ჩვენს ექსპერიმენტში არის შედეგების ორი კატეგორია: ერთი კატეგორია წითელი მანქანებისთვის და ერთი ლურჯი მანქანებისთვის. ამიტომ, ჩვენს ექსპერიმენტში გვაქვს თავისუფლების 2-1 = 1 ხარისხი. წითელ, ლურჯ და მწვანე მანქანებს რომ შევადაროთ, თავისუფლების 2 გრადუსი გვექნებოდა და ა.შ.

4. შეადარეთ მოსალოდნელი და დაკვირვებული შედეგები chi-square ტესტის გამოყენებით

Chi-square (დაწერილი "x2") არის რიცხვითი მნიშვნელობა, რომელიც ზომავს განსხვავებას ექსპერიმენტის მოსალოდნელ და დაკვირვებულ მნიშვნელობებს შორის. chi-კვადრატის განტოლება არის x2 = Σ((o-e)2/e), სადაც "o" არის დაკვირვებული მნიშვნელობა და "e" არის მოსალოდნელი მნიშვნელობა. შეაჯამეთ მოცემული განტოლების შედეგები ყველა შესაძლო შედეგისთვის (იხ. ქვემოთ).

გაითვალისწინეთ, რომ ეს განტოლება მოიცავს შემაჯამებელ ოპერატორ Σ (სიგმა). სხვა სიტყვებით რომ ვთქვათ, თქვენ უნდა გამოთვალოთ ((|o-e|-.05)2/e) თითოეული შესაძლო შედეგისთვის და დაამატეთ რიცხვები ერთად chi-კვადრატის მნიშვნელობის მისაღებად. ჩვენს მაგალითში გვაქვს ორი შესაძლო შედეგი - ან მანქანა, რომელმაც მიიღო ჯარიმა, არის წითელი ან ლურჯი. ასე რომ, ჩვენ უნდა დავთვალოთ ((o-e)2/e) ორჯერ - ერთხელ წითელი მანქანებისთვის და ერთხელ ლურჯი მანქანებისთვის.

მაგალითი: მოდით ჩავრთოთ ჩვენი მოსალოდნელი და დაკვირვებული მნიშვნელობები განტოლებაში x2 = Σ((o-e)2/e). გახსოვდეთ, რომ შემაჯამებელი ოპერატორის გამო, ჩვენ უნდა დავთვალოთ ((o-e)2/e) ორჯერ - ერთხელ წითელი მანქანებისთვის და ერთხელ ლურჯი მანქანებისთვის. ჩვენ გავაკეთებთ ამ სამუშაოს შემდეგნაირად:
x2 = ((90-100)2/100) + (60-50)2/50)
x2 = ((-10)2/100) + (10)2/50)
x2 = (100/100) + (100/50) = 1 + 2 = 3.

5. აირჩიეთ მნიშვნელობის დონე

ახლა, როდესაც ჩვენ ვიცით თავისუფლების ხარისხების რაოდენობა ჩვენს ექსპერიმენტში და ვიცით chi-კვადრატის ტესტის მნიშვნელობა, ჩვენ კიდევ ერთი რამ უნდა გავაკეთოთ, სანამ ვიპოვით ჩვენს p- მნიშვნელობას. ჩვენ უნდა განვსაზღვროთ მნიშვნელობის დონე. საუბარი უბრალო ენამნიშვნელოვნების დონე მიუთითებს იმაზე, თუ რამდენად დარწმუნებული ვართ ჩვენს შედეგებში. მნიშვნელოვნების დაბალი მნიშვნელობა შეესაბამება დაბალ ალბათობას, რომ ექსპერიმენტული შედეგები შემთხვევით იქნა მიღებული და პირიქით. მნიშვნელოვნების დონეები იწერება როგორც ათობითი წილადები (როგორიცაა 0.01), რაც შეესაბამება ალბათობას, რომ შემთხვევით მივიღეთ ექსპერიმენტული შედეგები (ამ შემთხვევაში, ამის ალბათობა 1%).

კონვენციით, მეცნიერები, როგორც წესი, ადგენენ თავიანთი ექსპერიმენტების მნიშვნელოვნების დონეს 0.05-მდე, ანუ 5%-მდე. ეს ნიშნავს, რომ ექსპერიმენტული შედეგები, რომლებიც აკმაყოფილებენ მნიშვნელოვნების ასეთ კრიტერიუმს, შეიძლება მიღებულ იქნას მხოლოდ 5%-იანი ალბათობით მხოლოდ შემთხვევით. სხვა სიტყვებით რომ ვთქვათ, არის 95% შანსი, რომ შედეგები გამოწვეული იყო იმით, თუ როგორ მანიპულირებდა მეცნიერი ექსპერიმენტულ ცვლადებზე და არა შემთხვევით. ექსპერიმენტების უმეტესობისთვის საკმარისია 95% ნდობა იმისა, რომ არსებობს ორ ცვლადს შორის კავშირი, რათა ჩაითვალოს, რომ ისინი "ნამდვილად" არიან დაკავშირებული ერთმანეთთან.

მაგალითი: ჩვენი მაგალითისთვის წითელი და ლურჯი მანქანებით, მივყვეთ მეცნიერებს შორის არსებულ კონვენციას და დავაყენოთ მნიშვნელოვნების დონე 0.05-ზე.

6. გამოიყენეთ chi-კვადრატის განაწილების მონაცემთა ცხრილი თქვენი p-მნიშვნელობის საპოვნელად

მეცნიერები და სტატისტიკოსები იყენებენ დიდ ცხრილებს თავიანთი ექსპერიმენტების p-მნიშვნელობის გამოსათვლელად. ცხრილის მონაცემებს ჩვეულებრივ აქვთ ვერტიკალური ღერძი მარცხნივ, რომელიც შეესაბამება თავისუფლების გრადუსის რაოდენობას და ჰორიზონტალური ღერძი ზევით, p-მნიშვნელობის შესაბამისი. გამოიყენეთ ცხრილის მონაცემები, რომ ჯერ იპოვოთ თქვენი თავისუფლების ხარისხი, შემდეგ შეხედეთ თქვენს სერიას მარცხნიდან მარჯვნივ, სანამ არ იპოვით პირველ მნიშვნელობას, რომელიც აღემატება თქვენს chi-კვადრატს. შეხედეთ შესაბამის p-მნიშვნელობას თქვენი სვეტის ზედა ნაწილში. თქვენი p-მნიშვნელობა არის ამ და მომდევნო რიცხვს შორის (თქვენი მარცხნივ).

Chi-კვადრატის განაწილების ცხრილების მიღება შესაძლებელია მრავალი წყაროდან (აქ შეგიძლიათ იპოვოთ ერთი ამ ბმულზე).

მაგალითი: ჩვენი ჩი-კვადრატის მნიშვნელობა იყო 3. ვინაიდან ვიცით, რომ ჩვენს ექსპერიმენტში თავისუფლების მხოლოდ 1 ხარისხია, პირველივე მწკრივს ავირჩევთ. ჩვენ მივდივართ მარცხნიდან მარჯვნივ ამ ხაზის გასწვრივ, სანამ არ შევხვდებით 3-ზე მეტ მნიშვნელობას, ჩვენი chi-კვადრატის ტესტის მნიშვნელობას. პირველი, რომელსაც ვპოულობთ არის 3.84. ჩვენი სვეტის ძიებისას, ჩვენ ვხედავთ, რომ შესაბამისი p-მნიშვნელობა არის 0.05. ეს ნიშნავს, რომ ჩვენი p-მნიშვნელობა არის 0.05-დან 0.1-მდე (შემდეგი უმაღლესი p-მნიშვნელობა ცხრილში).

7. გადაწყვიტეთ უარყოთ თუ შეინარჩუნოთ თქვენი ნულოვანი ჰიპოთეზა

ვინაიდან თქვენ დაადგინეთ თქვენი ექსპერიმენტისთვის სავარაუდო p-მნიშვნელობა, უნდა გადაწყვიტოთ, უარყოთ თუ არა თქვენი ექსპერიმენტის ნულოვანი ჰიპოთეზა (გაიხსენეთ, ეს არის ჰიპოთეზა, რომ თქვენ მიერ მანიპულირებული ექსპერიმენტული ცვლადები გავლენას არ ახდენდნენ თქვენ მიერ დაკვირვებულ შედეგებზე). თუ თქვენი p-მნიშვნელობა ნაკლებია, ვიდრე თქვენი მნიშვნელობის დონე, გილოცავთ, თქვენ დაამტკიცეთ, რომ არსებობს ძალიან სავარაუდო კავშირი თქვენს მიერ მანიპულირებულ ცვლადებსა და თქვენ მიერ დაკვირვებულ შედეგებს შორის. თუ თქვენი p-მნიშვნელობა უფრო მაღალია, ვიდრე თქვენი მნიშვნელოვნების დონე, თქვენ ვერ იქნებით დარწმუნებული, იყო თუ არა თქვენს მიერ დაკვირვებული შედეგები გამოწვეული სუფთა შემთხვევითობით ან თქვენი ცვლადებით მანიპულირებით.

მაგალითი: ჩვენი p-მნიშვნელობა არის 0.05-დან 0.1-მდე. ეს აშკარად არ არის 0.05-ზე ნაკლები, ასე რომ, სამწუხაროდ, ჩვენ არ შეგვიძლია უარვყოთ ჩვენი ნულოვანი ჰიპოთეზა. ეს ნიშნავს, რომ ჩვენ არ მივაღწიეთ მინიმუმ 95%-იან ალბათობას იმის თქმის, რომ ჩვენს ქალაქში პოლიცია გასცემს ბილეთებს წითელ და ლურჯ მანქანებზე, რომლის ალბათობაც საკმაოდ განსხვავდება ეროვნული საშუალოდან.

სხვა სიტყვებით რომ ვთქვათ, არის 5-10% შანსი, რომ შედეგები, რომელსაც ჩვენ ვაკვირდებით, იყოს არა მდებარეობის ცვლილების შედეგი (ქალაქის, არა მთელი ქვეყნის ანალიზი), არამედ უბრალოდ უბედური შემთხვევა. ვინაიდან ჩვენ ვითხოვდით 5%-ზე ნაკლებ სიზუსტეს, ვერ ვიტყვით, რომ დარწმუნებული ვართ, რომ ჩვენს ქალაქში პოლიცია ნაკლებად მიკერძოებულია წითელი მანქანების მიმართ - არის მცირე (მაგრამ სტატისტიკურად მნიშვნელოვანი) შანსი, რომ ეს ასე არ იყოს.

ფსიქოლოგიაში სადიპლომო და სამაგისტრო ნაშრომების სტატისტიკური გამოთვლების შედეგების ცხრილებში ყოველთვის არის ინდიკატორი „პ“.

მაგალითად, შესაბამისად კვლევის მიზნებიგამოითვალა განსხვავებები მოზარდობის ბიჭებსა და გოგოებში ცხოვრების აზრიანობის დონეზე.

	საშუალო		Mann-Whitney U ტესტი	სტატისტიკური მნიშვნელოვნების დონე (p)
	ბიჭები (20 ადამიანი)	გოგოები (5 ადამიანი)	Mann-Whitney U ტესტი	სტატისტიკური მნიშვნელოვნების დონე (p)
მიზნები	28,9	35,2	17,5	0,027*
პროცესი	30,1	32,0	38,5	0,435
შედეგი	25,2	29,0	29,5	0,164
კონტროლის ადგილი - "მე"	20,3	23,6		0,067
კონტროლის ადგილი - "ცხოვრება"	30,4	33,8	27,5	0,126
ცხოვრების აზრიანი	98,9	111,2		0,103

* - განსხვავებები სტატისტიკურად მნიშვნელოვანია (გვ≤ 0,05)

მარჯვენა სვეტი მიუთითებს "p"-ის მნიშვნელობას და მისი მნიშვნელობით არის შესაძლებელი იმის დადგენა, არის თუ არა განსხვავებები სამომავლო ცხოვრების მნიშვნელობაში ბიჭებსა და გოგოებში მნიშვნელოვანი თუ არა. წესი მარტივია:

თუ სტატისტიკური მნიშვნელოვნების დონე „p“ არის 0.05-ზე ნაკლები ან ტოლი, მაშინ დავასკვნით, რომ განსხვავებები მნიშვნელოვანია. ზემოთ მოცემულ ცხრილში, ბიჭებსა და გოგოებს შორის განსხვავებები მნიშვნელოვანია ინდიკატორთან "მიზნები" - სამომავლო ცხოვრების აზრიანი. გოგონებში ეს მაჩვენებელი სტატისტიკურად მნიშვნელოვნად მაღალია, ვიდრე ბიჭებში.
თუ სტატისტიკური მნიშვნელოვნების დონე „p“ მეტია 0,05-ზე, მაშინ დასკვნა გამოდის, რომ განსხვავებები არ არის მნიშვნელოვანი. ზემოთ მოცემულ ცხრილში, ბიჭებსა და გოგოებს შორის განსხვავებები არ არის მნიშვნელოვანი ყველა სხვა ინდიკატორისთვის, გარდა პირველისა.

საიდან მოდის სტატისტიკური მნიშვნელოვნების დონე „p“.

გამოითვლება სტატისტიკური მნიშვნელოვნების დონე სტატისტიკური პროგრამასტატისტიკური კრიტერიუმის გამოთვლასთან ერთად. ამ პროგრამებში ასევე შეგიძლიათ დააწესოთ სტატისტიკური მნიშვნელოვნების დონის კრიტიკული ზღვარი და შესაბამისი მაჩვენებლები გამოკვეთილი იქნება პროგრამის მიერ.

მაგალითად, STATISTICA პროგრამაში, კორელაციების გამოთვლისას, შეგიძლიათ დააყენოთ p ლიმიტი, მაგალითად, 0.05 და ყველა სტატისტიკურად მნიშვნელოვანი ურთიერთობა მონიშნული იქნება წითლად.

თუ სტატისტიკური კრიტერიუმის გამოთვლა ხორციელდება ხელით, მაშინ მნიშვნელოვნების დონე „p“ განისაზღვრება მიღებული კრიტერიუმის მნიშვნელობის კრიტიკულ მნიშვნელობასთან შედარებით.

რას აჩვენებს სტატისტიკური მნიშვნელოვნების დონე „პ“.

ყველა სტატისტიკური გამოთვლა მიახლოებითია. ამ მიახლოების დონე განსაზღვრავს "r". მნიშვნელოვნების დონე იწერება ათწილადების სახით, მაგალითად, 0.023 ან 0.965. თუ ამ რიცხვს გავამრავლებთ 100-ზე, მივიღებთ p მაჩვენებელს პროცენტულად: 2,3% და 96,5%. ეს პროცენტები ასახავს იმის ალბათობას, რომ ჩვენი ვარაუდი ურთიერთობაზე, მაგალითად, აგრესიულობასა და შფოთვას შორის, არასწორია.

ანუ კორელაციის კოეფიციენტიაგრესიულობასა და შფოთვას შორის 0,58 მიიღება სტატისტიკური მნიშვნელოვნების დონეზე 0,05 ან 5% შეცდომის ალბათობით. რას ნიშნავს ეს კონკრეტულად?

ჩვენ მიერ აღმოჩენილი კორელაცია ნიშნავს, რომ ჩვენს ნიმუშში შეიმჩნევა შემდეგი ნიმუში: რაც უფრო მაღალია აგრესიულობა, მით უფრო მაღალია შფოთვა. ანუ, თუ ავიღებთ ორ თინეიჯერს და ერთ-ერთს ექნება უფრო მაღალი შფოთვა, ვიდრე მეორეს, მაშინ, თუ ვიცით დადებითი კორელაციის შესახებ, შეგვიძლია ვთქვათ, რომ ამ მოზარდსაც ექნება უფრო მაღალი აგრესიულობა. მაგრამ რადგან სტატისტიკაში ყველაფერი მიახლოებითია, მაშინ, ამის მტკიცებით, ჩვენ ვაღიარებთ, რომ შეგვიძლია შეცდომა დავუშვათ და შეცდომის ალბათობა არის 5%. ანუ 20 ასეთი შედარება მოზარდების ამ ჯგუფში რომ გავაკეთეთ, შეგვიძლია შეცდომა დავუშვათ აგრესიულობის დონის პროგნოზს ერთხელ, შფოთვის ცოდნით.

სტატისტიკური მნიშვნელოვნების რომელი დონეა უკეთესი: 0,01 თუ 0,05

სტატისტიკური მნიშვნელოვნების დონე ასახავს შეცდომის ალბათობას. აქედან გამომდინარე, შედეგი p=0.01-ზე უფრო ზუსტია, ვიდრე p=0.05-ზე.

ფსიქოლოგიურ კვლევაში მიღებულია შედეგების სტატისტიკური მნიშვნელობის ორი მისაღები დონე:

p=0.01 - შედეგის მაღალი სანდოობა შედარებითი ანალიზიან ურთიერთობების ანალიზი;

p=0.05 - საკმარისი სიზუსტე.

ვიმედოვნებ, რომ ეს სტატია დაგეხმარებათ დამოუკიდებლად დაწეროთ ფსიქოლოგიური ნაშრომი. თუ დახმარება გჭირდებათ, გთხოვთ დაუკავშირდეთ (ყველა სახის სამუშაო ფსიქოლოგიაში; სტატისტიკური გამოთვლები).