كيفية حساب مستوى الدلالة الإحصائية. اشرح ما هو مستوى الأهمية الإحصائية

معلمات توزيع العينة التي تحددها سلسلة من القياسات هي متغيرات عشوائية ، وبالتالي ، فإن انحرافاتها عن المعلمات العامة ستكون عشوائية أيضًا. تقييم هذه الانحرافات هو احتمالي بطبيعته - في التحليل الإحصائي ، يمكن للمرء فقط الإشارة إلى احتمال حدوث خطأ معين.

دع المعلمة العامة أمستمدة من تجربة تقدير غير متحيز أ*. نقوم بتعيين احتمال كبير بما فيه الكفاية b (بحيث يمكن اعتبار حدث مع احتمال b مؤكدًا عمليًا) ونجد مثل هذه القيمة e b = F(ب) من أجله

نطاق القيم الممكنة عمليًا للخطأ الذي يحدث عند الاستبدال أعلى ال أ* ، سيكون ± e b. الأخطاء الكبيرة في القيمة المطلقة ستظهر فقط مع احتمال ضئيل.

اتصل مستوى الأهمية. خلاف ذلك ، يمكن تفسير التعبير (4.1) على أنه احتمال أن تكون القيمة الحقيقية للمعامل أيقع في الداخل

. (4.3)

يسمى الاحتمال ب مستوى الثقةويميز موثوقية التقدير الذي تم الحصول عليه. فترة أناب = أ* ± e b يسمى فاصل الثقة. حدود الفاصل أ¢ = أ* - البريد ب و أ¢¢ = أ* + البريد ب حدود الثقة. يحدد فاصل الثقة عند مستوى ثقة معين دقة التقدير. تعتمد قيمة فاصل الثقة على مستوى الثقة الذي يتم ضمان العثور على المعلمة به أداخل فاصل الثقة: كلما زادت قيمة b ، زادت الفترة أناب (وقيمة البريد ب). تتجلى الزيادة في عدد التجارب في انخفاض في فاصل الثقة مع احتمال ثقة ثابت أو في زيادة احتمالية الثقة مع الحفاظ على فاصل الثقة.

من الناحية العملية ، عادةً ما يُصلح المرء قيمة احتمال الثقة (0.9 ؛ 0.95 أو 0.99) ثم يحدد فاصل الثقة للنتيجة أناب. عند إنشاء فاصل ثقة ، يتم حل مشكلة الانحراف المطلق:

وبالتالي ، إذا كان قانون التوزيع الخاص بالتقدير معروفًا أ* ، سيتم حل مشكلة تحديد فترة الثقة ببساطة. ضع في اعتبارك إنشاء فاصل ثقة للتوقع الرياضي لمتغير عشوائي موزع بشكل طبيعي Xبمعيار عام معروف على حجم العينة ن. أفضل ملزمة للتوقع مهو متوسط ​​العينة مع الانحراف المعياري للمتوسط

.

باستخدام وظيفة لابلاس ، نحصل عليها

. (4.5)

بالنظر إلى احتمال الثقة ب ، نحدد القيمة من جدول دالة لابلاس (الملحق 1) . ثم تأخذ فترة الثقة للتوقع الرياضي الشكل

. (4.7)

من (4.7) يمكن ملاحظة أن الانخفاض في فاصل الثقة يتناسب عكسياً مع الجذر التربيعي لعدد التجارب.

تتيح لنا معرفة التباين العام تقدير التوقع الرياضي حتى لملاحظة واحدة. إذا كان لمتغير عشوائي يتم توزيعه بشكل طبيعي Xنتيجة التجربة ، القيمة X 1 ، ثم فاصل الثقة للتوقع الرياضي للمختار ب له الشكل

أين يو 1-ص/ 2 - كمية التوزيع الطبيعي القياسي (الملحق 2).

قانون توزيع الدرجات أ* يعتمد على قانون توزيع الكمية Xوعلى وجه الخصوص ، على المعلمة نفسها أ. للتغلب على هذه الصعوبة ، يتم استخدام طريقتين في الإحصاء الرياضي:

1) تقريبي - في ن³ 50 استبدل المعلمات غير المعروفة في التعبير عن e b بتقديراتها ، على سبيل المثال:

2) من متغير عشوائي أ* انتقل إلى متغير عشوائي آخر Q * ، لا يعتمد قانون التوزيع الخاص به على المعلمة المقدرة أ، ولكن يعتمد فقط على حجم العينة. نوعلى نوع قانون توزيع الكمية X. تمت دراسة الكميات من هذا النوع بأكبر قدر من التفصيل للتوزيع الطبيعي للمتغيرات العشوائية. عادةً ما تُستخدم الكميات المتماثلة كحدود ثقة لـ Q ¢ و Q ¢¢

, (4.9)

أو مع الأخذ في الاعتبار (4.2)

. (4.10)

4.2 اختبار الفرضيات الإحصائية ، اختبارات الأهمية ،

أخطاء من النوع الأول والثاني.

تحت الفرضيات الإحصائيةيتم فهم بعض الافتراضات حول توزيعات عامة السكان لمتغير عشوائي واحد أو آخر. يُفهم اختبار الفرضيات على أنه مقارنة لبعض المؤشرات الإحصائية ، معايير التحقق (معايير الأهمية) محسوبة من العينة ، مع تحديد قيمها على افتراض أن الفرضية المقدمة صحيحة. عند اختبار الفرضيات ، عادة ما يتم اختبار بعض الفرضيات. ح 0 مقارنة بالفرضية البديلة ح 1 .

لتقرير قبول أو رفض فرضية ، يتم إعطاء مستوى الأهمية ص. مستويات الأهمية الأكثر شيوعًا هي 0.10 و 0.05 و 0.01. وفقًا لهذا الاحتمال ، باستخدام الفرضية حول توزيع التقدير Q * (معيار الأهمية) ، تم العثور على حدود الثقة الكمية ، كقاعدة عامة ، متناظرة Q ص/ 2 و س 1- ص/ 2. ارقام س ص/ 2 و س 1- ص/ 2 تسمى القيم الحرجة للفرضية؛ قيم Q *< Qص/ 2 و س *> س 1 - ص/ 2 شكل حرج


منطقة الفرضية (أو منطقة عدم قبول الفرضية) (الشكل 12).

أرز. 12.المجال الحيوي أرز. 13.التحقق من الإحصاء

الفرضيات. الفرضيات.

إذا كان Q 0 الموجود في العينة يقع بين Q ص/ 2 و س 1- ص/ 2 ، فإن الفرضية تعترف بهذه القيمة على أنها عشوائية وبالتالي لا توجد أسباب لرفضها. إذا كانت قيمة Q 0 تقع في المنطقة الحرجة ، فوفقًا لهذه الفرضية ، يكون ذلك مستحيلًا عمليًا. ولكن منذ ظهور الفرضية نفسها مرفوضة.

هناك نوعان من الأخطاء التي يمكن ارتكابها عند اختبار الفرضيات. اكتب أنا خطأهل هذا رفض فرضية صحيحة بالفعل. احتمال حدوث مثل هذا الخطأ ليس أكبر من مستوى الأهمية المقبول. خطأ من النوع الثانيهل هذا الفرضية مقبولة لكنها في الحقيقة خاطئة. يكون احتمال حدوث هذا الخطأ أقل ، وكلما زاد مستوى الأهمية ، لأن هذا يزيد من عدد الفرضيات المرفوضة. إذا كان احتمال حدوث خطأ من النوع الثاني هو a ، فإن القيمة (1 - أ) تسمى قوة المعيار.

على التين. يوضح الشكل 13 منحنيين لكثافة توزيع المتغير العشوائي Q ، يقابلان فرضيتين ح 0 و حواحد . إذا كانت القيمة التي تم الحصول عليها من التجربة هي Q> Q ص، ثم يتم رفض الفرضية. ح 0 والفرضية مقبولة ح 1 والعكس بالعكس إذا س< Qص.

المنطقة الواقعة تحت منحنى الكثافة الاحتمالية المقابلة لصحة الفرضية ح 0 على يمين قيمة Q ص، يساوي مستوى الأهمية ص، أي احتمالات الخطأ من النوع الأول. المنطقة الواقعة تحت منحنى الكثافة الاحتمالية المقابلة لصحة الفرضية ح 1 على يسار Q ص، يساوي احتمال الخطأ من النوع الثاني أ ، ويمين Q ص- قوة المحك (1 - أ). وهكذا ، أكثر صزاد عدد (1 - أ). عند اختبار فرضية ما ، يحاولون الاختيار من بين جميع المعايير الممكنة التي لها احتمالية أقل لخطأ من النوع الثاني ، عند مستوى معين من الأهمية..

عادة ، كمستوى الأهمية الأمثل عند اختبار الفرضيات ، استخدم ص= 0.05 ، لأنه إذا تم قبول الفرضية التي يتم اختبارها بمستوى معين من الأهمية ، فيجب بالطبع التعرف على الفرضية على أنها متوافقة مع البيانات التجريبية ؛ من ناحية أخرى ، لا يوفر استخدام هذا المستوى من الأهمية أسبابًا لرفض الفرضية.

على سبيل المثال ، تم العثور على قيمتين وبعض معلمات العينة ، والتي يمكن اعتبارها تقديرات للمعلمات العامة أ 1 و أ 2. من المفترض أن يكون الاختلاف بين و هو عشوائي وأن المعلمات العامة أ 1 و أ 2 متساوية ، أي أ 1 = أ 2. هذه الفرضية تسمى لا شيء، أو فرضية العدم. لاختبارها ، تحتاج إلى معرفة ما إذا كان التناقض بين الفرضية الصفرية وهامًا لها. للقيام بذلك ، عادةً ما يتحقق المرء من متغير عشوائي D = - ويتحقق مما إذا كان اختلافه عن الصفر مهمًا. في بعض الأحيان يكون من الأنسب النظر في القيمة / من خلال مقارنتها بالوحدة.

رفضوا فرضية العدم ، قبلوا الفرضية البديلة ، التي تنقسم إلى قسمين:> و< . Если одно из этих равенств заведомо невозможно, то альтернативная гипотеза называется من جانب واحد، وللتحقق منه ، استخدم من جانب واحدمعايير الأهمية (على عكس التقليدية ، ثنائي). في هذه الحالة ، من الضروري النظر إلى نصفي المنطقة الحرجة فقط (الشكل 12).

فمثلا، ص= 0.05 بمعيار من جانبين ، تتوافق القيمتان الحرجتان Q 0.025 و Q 0.975 ، أي Q * التي أخذت القيم Q * تعتبر مهمة (غير عشوائية)< Q 0.025 и Q * >س 0.975. بمعيار أحادي الجانب ، من الواضح أن إحدى هذه التفاوتات مستحيلة (على سبيل المثال ، Q *< Q 0.025) и значимыми будут лишь Q * >س 0.975. احتمال آخر عدم مساواة هو 0.025 ، وبالتالي فإن مستوى الأهمية سيكون 0.025. وبالتالي ، إذا تم استخدام نفس الأرقام الحرجة لاختبار الأهمية وحيد الذيل كما في الاختبار ثنائي الطرف ، فإن هذه القيم سوف تتوافق مع نصف مستوى الأهمية.

عادةً ، بالنسبة للاختبار أحادي الطرف ، يتم أخذ نفس مستوى الأهمية للاختبار ثنائي الطرف ، حيث يوفر كلا الاختبارين في ظل هذه الظروف نفس الخطأ من النوع الأول. للقيام بذلك ، يجب اشتقاق الاختبار أحادي الطرف من اختبار ثنائي الطرف ، وهو ما يعادل ضعف مستوى الأهمية من المستوى المقبول. للحفاظ على مستوى الأهمية للاختبار أحادي الطرف ص= 0.05 ، للثنائي فمن الضروري أن تأخذ ص= 0.10 والتي تعطي القيم الحرجة Q 0.05 و Q 0.95. من بين هؤلاء ، بالنسبة للاختبار من جانب واحد ، سيبقى المرء ، على سبيل المثال ، Q 0.95. مستوى الأهمية للاختبار أحادي الطرف هو 0.05. يتوافق نفس المستوى من الأهمية للاختبار ثنائي الذيل مع القيمة الحرجة Q 0.975. لكن س 0.95< Q 0.975 , значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода.

يعد مستوى الأهمية في الإحصاء مؤشرًا مهمًا يعكس درجة الثقة في دقة وصحة البيانات المستلمة (المتوقعة). يستخدم هذا المفهوم على نطاق واسع في مختلف المجالات: من البحث الاجتماعي إلى الاختبار الإحصائي للفرضيات العلمية.

تعريف

يوضح مستوى الدلالة الإحصائية (أو النتيجة ذات الدلالة الإحصائية) ما هو احتمال التكرار العشوائي للمؤشرات المدروسة. يتم التعبير عن الأهمية الإحصائية الإجمالية للظاهرة بواسطة القيمة p (المستوى p). في أي تجربة أو ملاحظة ، هناك احتمال أن البيانات التي تم الحصول عليها قد نشأت بسبب أخطاء أخذ العينات. هذا ينطبق بشكل خاص على علم الاجتماع.

أي أن القيمة ذات دلالة إحصائية ، والتي يكون احتمال حدوثها العشوائي صغيرًا للغاية أو يميل إلى التطرف. الحد الأقصى في هذا السياق هو درجة انحراف الإحصائيات عن الفرضية الصفرية (فرضية يتم اختبارها من أجل التوافق مع بيانات العينة التي تم الحصول عليها). في الممارسة العلمية ، يتم اختيار مستوى الأهمية قبل جمع البيانات ، وكقاعدة عامة ، يكون معاملها 0.05 (5٪). بالنسبة للأنظمة التي تكون فيها القيم الدقيقة حرجة ، قد يكون هذا 0.01 (1٪) أو أقل.

خلفية

تم تقديم مفهوم مستوى الأهمية من قبل الإحصائي وعالم الوراثة البريطاني رونالد فيشر في عام 1925 عندما كان يطور تقنية لاختبار الفرضيات الإحصائية. عند تحليل أي عملية ، هناك احتمال معين لظواهر معينة. تنشأ الصعوبات عند العمل بنسب مئوية صغيرة (أو غير واضحة) من الاحتمالات التي تندرج تحت مفهوم "خطأ القياس".

عند العمل مع الإحصائيات التي لم تكن محددة بما يكفي للاختبار ، واجه العلماء مشكلة الفرضية الصفرية ، والتي "تمنع" العمل بقيم صغيرة. اقترح فيشر لمثل هذه الأنظمة تحديد احتمال الأحداث عند 5 ٪ (0.05) كقطع عينة مناسب يسمح للمرء برفض فرضية العدم في الحسابات.

إدخال معامل ثابت

في عام 1933 علماء جرزيأوصى نيومان وإيجون بيرسون في أوراقهم بتحديد مستوى معين من الأهمية مسبقًا (قبل جمع البيانات). أمثلة على استخدام هذه القواعد واضحة للعيان خلال الانتخابات. لنفترض أن هناك اثنين من المرشحين ، أحدهما يحظى بشعبية كبيرة والآخر غير معروف جيدًا. من الواضح أن المرشح الأول سيفوز في الانتخابات ، وفرص المرشح الثاني تتجه إلى الصفر. كافح - ولكن ليس على قدم المساواة: هناك دائمًا احتمال وجود قوة قاهرة ، ومعلومات مثيرة ، وقرارات غير متوقعة يمكن أن تغير نتائج الانتخابات المتوقعة.

اتفق نيومان وبيرسون على أن مستوى الأهمية الذي اقترحه فيشر والبالغ 0.05 (يُشار إليه بالرمز α) هو الأكثر ملاءمة. ومع ذلك ، عارض فيشر نفسه في عام 1956 تثبيت هذه القيمة. وأعرب عن اعتقاده أنه يجب تحديد مستوى α وفقًا لظروف محددة. على سبيل المثال ، في فيزياء الجسيمات تبلغ 0.01.

ف القيمة

تم استخدام مصطلح القيمة p لأول مرة بواسطة Brownlee في عام 1960. المستوى P (القيمة p) هو مؤشر يرتبط عكسيًا بحقيقة النتائج. تتوافق أعلى قيمة p مع أدنى مستوى من الثقة في علاقة العينة بين المتغيرات.

تعكس هذه القيمة احتمال الأخطاء المرتبطة بتفسير النتائج. افترض قيمة p = 0.05 (1/20). يُظهر فرصة بنسبة خمسة بالمائة أن العلاقة بين المتغيرات الموجودة في العينة هي مجرد ميزة عشوائية للعينة. أي ، إذا كان هذا الاعتماد غائبًا ، فعند تكرار التجارب المماثلة ، في المتوسط ​​، في كل دراسة عشرين ، يمكن للمرء أن يتوقع نفس الاعتماد أو اعتمادًا أكبر بين المتغيرات. غالبًا ما يعتبر المستوى p بمثابة "هامش" مستوى الخطأ.

بالمناسبة ، قد لا تعكس القيمة p العلاقة الحقيقية بين المتغيرات ، ولكنها تظهر فقط قيمة متوسطة معينة ضمن الافتراضات. على وجه الخصوص ، سيعتمد التحليل النهائي للبيانات أيضًا على القيم المختارة لهذا المعامل. مع مستوى p = 0.05 ستكون هناك بعض النتائج ومعامل يساوي 0.01 ، نتائج أخرى.

اختبار الفرضيات الإحصائية

مستوى الأهمية الإحصائية مهم بشكل خاص عند اختبار الفرضيات. على سبيل المثال ، عند حساب اختبار ثنائي الطرف ، يتم تقسيم منطقة الرفض بالتساوي على طرفي توزيع العينات (بالنسبة إلى الإحداثي الصفري) ويتم حساب حقيقة البيانات التي تم الحصول عليها.

لنفترض ، عند مراقبة عملية معينة (ظاهرة) ، اتضح أن المعلومات الإحصائية الجديدة تشير إلى تغييرات صغيرة بالنسبة للقيم السابقة. في الوقت نفسه ، فإن التناقضات في النتائج صغيرة ، وليست واضحة ، ولكنها مهمة للدراسة. يواجه الاختصاصي معضلة: هل تحدث التغييرات بالفعل أم أنها أخطاء في أخذ العينات (عدم دقة القياس)؟

في هذه الحالة ، يتم تطبيق الفرضية الصفرية أو رفضها (يتم شطب كل شيء على أنه خطأ ، أو يتم التعرف على التغيير في النظام على أنه أمر واقع). تعتمد عملية حل المشكلة على نسبة الأهمية الإحصائية الإجمالية (قيمة p) ومستوى الأهمية (α). إذا كان المستوى p< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

القيم المستخدمة

يعتمد مستوى الأهمية على المادة التي تم تحليلها. في الممارسة العملية ، يتم استخدام القيم الثابتة التالية:

  • α = 0.1 (أو 10٪) ؛
  • α = 0.05 (أو 5٪) ؛
  • α = 0.01 (أو 1٪) ؛
  • α = 0.001 (أو 0.1٪).

كلما زادت دقة الحسابات المطلوبة ، كلما قل المعامل α. بطبيعة الحال ، تتطلب التوقعات الإحصائية في الفيزياء والكيمياء والأدوية وعلم الوراثة دقة أكبر مما هي عليه في العلوم السياسية وعلم الاجتماع.

عتبات الأهمية في مناطق محددة

في المجالات عالية الدقة مثل فيزياء الجسيمات والتصنيع ، غالبًا ما يتم التعبير عن الدلالة الإحصائية على أنها نسبة الانحراف المعياري (يُشار إليها بمعامل سيجما σ) بالنسبة إلى توزيع الاحتمالية العادي (التوزيع الغوسي). σ هو مؤشر إحصائي يحدد انتشار قيم كمية معينة بالنسبة للتوقعات الرياضية. تستخدم لرسم احتمالية الأحداث.

اعتمادًا على مجال المعرفة ، يختلف المعامل اختلافًا كبيرًا. على سبيل المثال ، عند التنبؤ بوجود بوزون هيغز ، فإن المعلمة σ تساوي خمسة (σ = 5) ، والتي تتوافق مع القيمة p = 1 / 3.5 مليون. مناطق.

نجاعة

يجب أن يؤخذ في الاعتبار أن المعاملين α و p-value ليسا خصائص دقيقة. مهما كان مستوى الأهمية في إحصائيات الظاهرة قيد الدراسة ، فإنه ليس أساسًا غير مشروط لقبول الفرضية. على سبيل المثال ، كلما كانت قيمة α أصغر ، زادت فرصة إنشاء الفرضية بشكل كبير. ومع ذلك ، هناك خطر حدوث خطأ ، مما يقلل من القوة الإحصائية (الأهمية) للدراسة.

قد يتوصل الباحثون الذين يركزون حصريًا على النتائج ذات الدلالة الإحصائية إلى استنتاجات خاطئة. في الوقت نفسه ، من الصعب إعادة التحقق من عملهم ، لأنهم يطبقون الافتراضات (التي ، في الواقع ، هي قيم α و p-value). لذلك ، يوصى دائمًا ، جنبًا إلى جنب مع حساب الأهمية الإحصائية ، بتحديد مؤشر آخر - حجم التأثير الإحصائي. حجم التأثير هو مقياس كمي لقوة التأثير.

القيمة تسمى ذات دلالة إحصائية، إذا كان احتمال الحدوث العشوائي البحت له أو حتى القيم المتطرفة صغيرًا. هنا ، المتطرف هو درجة الانحراف عن فرضية العدم. يقال إن الاختلاف "ذو دلالة إحصائية" إذا كانت هناك بيانات من غير المحتمل أن تحدث ، بافتراض عدم وجود الاختلاف ؛ لا يعني هذا التعبير أن هذا الاختلاف يجب أن يكون كبيرًا أو مهمًا أو مهمًا بالمعنى العام للكلمة.

مستوى أهمية الاختبار هو المفهوم التقليدي لاختبار الفرضيات في إحصائيات التردد. يتم تعريفه على أنه احتمال اتخاذ قرار برفض الفرضية الصفرية إذا كانت الفرضية الصفرية صحيحة في الواقع (يُعرف القرار بالخطأ من النوع الأول ، أو القرار الإيجابي الخاطئ.) غالبًا ما تعتمد عملية اتخاذ القرار على قيمة p (اقرأ "قيمة pi"): إذا كانت قيمة p أقل من مستوى الأهمية ، فسيتم رفض الفرضية الصفرية. كلما صغرت القيمة الاحتمالية ، زادت أهمية إحصائية الاختبار. كلما كانت قيمة p أصغر ، كان سبب رفض الفرضية الصفرية أقوى.

عادة ما يتم الإشارة إلى مستوى الأهمية بالحرف اليوناني α (ألفا). مستويات الأهمية الشائعة هي 5٪ و 1٪ و 0.1٪. إذا أنتج الاختبار قيمة p أقل من مستوى α ، فسيتم رفض الفرضية الصفرية. يشار إلى هذه النتائج بشكل غير رسمي على أنها "ذات دلالة إحصائية". على سبيل المثال ، إذا قال أحدهم أن "احتمالية حدوث ما هي مصادفة تساوي واحدًا في الألف" ، فإنهم يعنيون مستوى أهمية بنسبة 0.1٪.

القيم المختلفة للمستوى α لها مزاياها وعيوبها. تعطي مستويات ألفا الأصغر مزيدًا من الثقة في أن الفرضية البديلة التي تم إنشاؤها بالفعل مهمة ، ولكن هناك خطر أكبر لعدم رفض فرضية فارغة خاطئة (خطأ من النوع الثاني ، أو "قرار سلبي كاذب") ، وبالتالي قوة إحصائية أقل. يتطلب اختيار مستوى α حتماً مفاضلة بين الأهمية والقوة ، وبالتالي بين احتمالية الخطأ من النوع الأول والنوع الثاني. في الداخل أوراق علميةغالبًا ما يتم استخدام المصطلح غير الصحيح "الأهمية" بدلاً من مصطلح "الأهمية الإحصائية".

أنظر أيضا

ملحوظات

جورج كاسيلا ، روجر ل.بيرجراختبار الفرضية // الاستدلال الإحصائي. -الطبعة الثانية. - باسيفيك جروف ، كاليفورنيا: دوكسبري ، 2002. - س 397. - 660 ص. - ردمك 0-534-24312-6


مؤسسة ويكيميديا. 2010.

شاهد ما هو "مستوى الأهمية" في القواميس الأخرى:

    الرقم صغير جدًا بحيث يمكن اعتباره شبه مؤكد أن حدثًا مع احتمال α لن يحدث في تجربة واحدة. عادة U. z. تم إصلاحه بشكل تعسفي ، وهي: 0.05 ، 0.01 ، وبدقة خاصة 0.005 ، إلخ. في الجيول. الشغل… … الموسوعة الجيولوجية

    مستوى الأهمية- المعيار الإحصائي (يُطلق عليه أيضًا "مستوى ألفا" ويُشار إليه بحرف يوناني) هو الحد الأعلى لاحتمال الخطأ من النوع الأول (احتمال رفض فرضية العدم عندما تكون صحيحة بالفعل). القيم النموذجية هي ... قاموس الإحصاء الاجتماعي

    إنجليزي المستوى ، الأهمية ألمانية Signifikanzniveau. درجة المخاطرة هي أن الباحث قد يتوصل إلى استنتاج خاطئ حول مغالطة الفرضيات الإضافية ، بناءً على بيانات العينة. أنتينازي. موسوعة علم الاجتماع 2009 ... موسوعة علم الاجتماع

    مستوى الأهمية- - [L.G. Sumenko. القاموس الإنجليزي الروسي لتكنولوجيا المعلومات. م: GP TsNIIS ، 2003.] موضوعات تكنولوجيا المعلومات بشكل عام مستوى أهمية EN ... دليل المترجم الفني

    مستوى الأهمية- 3.31 مستوى الدلالة α: قيمة معطاة تمثل الحد الأعلى لاحتمال رفض فرضية إحصائية عندما تكون هذه الفرضية صحيحة. المصدر: GOST R ISO 12491 2011: مواد البناء والمنتجات ... ... قاموس - كتاب مرجعي للمصطلحات المعيارية والتقنية

    مستوى الأهمية- مفهوم الإحصاء الرياضي ، الذي يعكس درجة احتمالية استنتاج خاطئ فيما يتعلق بفرضية إحصائية حول توزيع سمة ، تم التحقق منها على أساس بيانات العينة. في البحث النفسي لمستوى كاف ... ... عصري العملية التعليمية: المفاهيم والمصطلحات الأساسية

    مستوى الأهمية- reikšmingumo lygis statusas T sritis automatika atitikmenys: engl. مستوى الأهمية vok. Signifikanzniveau، n rus. مستوى الأهمية ، m pranc. niveau de signifiance، m… Automatikos terminų žodynas

    مستوى الأهمية- reikšmingumo lygis statusas T sritis fizika atitikmenys: engl. مستوى الدلالة او الاهميه؛ مستوى الأهمية vok. Sicherheitsschwelle، f rus. مستوى الأهمية ، fpranc. نيفو دي دلالة ، م… فيزيكوس تيرميني žوديناس

    اختبار إحصائي ، راجع مستوى الأهمية ... الموسوعة السوفيتية العظمى

    مستوى الأهمية- انظر الأهمية ، المستوى ... قاموسفي علم النفس

كتب

  • "سري للغاية". لوبيانكا - لستالين حول الوضع في البلاد (1922-1934). المجلد 4. الجزء 1 ،. منشورات أساسية متعددة المجلدات - استعراض المعلوماتوملخصات OGPU - فريدة من حيث أهميتها العلمية وقيمتها ومحتواها ونطاقها. في هذا التاريخ ...
  • برنامج تعليمي كأداة لنظام إدارة الجودة للتعليم المهني ، تكاتشيفا غالينا فيكتوروفنا ، لوجاتشيف مكسيم سيرجيفيتش ، سامارين يوري نيكولايفيتش. تحلل الدراسة الممارسات الحالية لتشكيل محتوى البرامج التعليمية المهنية. يتم تحديد المكان والبنية والمحتوى ومستوى الأهمية ...

ف القيمة(هندسة) - القيمة المستخدمة عند اختبار الفرضيات الإحصائية. في الواقع ، هذا هو احتمال الخطأ عند رفض الفرضية الصفرية (خطأ من النوع الأول). يعد اختبار الفرضيات باستخدام القيمة P بديلاً لإجراء الاختبار الكلاسيكي من خلال القيمة الحرجة للتوزيع.

عادةً ما تكون القيمة P مساوية لاحتمال أن يأخذ متغير عشوائي بتوزيع معين (توزيع إحصائية الاختبار تحت فرضية العدم) قيمة لا تقل عن القيمة الفعلية لإحصاء الاختبار. ويكيبيديا.

وبعبارة أخرى ، فإن القيمة p هي أصغر مستوى من الأهمية (أي احتمال رفض فرضية حقيقية) والتي تؤدي إحصائية الاختبار المحسوبة من أجلها إلى رفض الفرضية الصفرية. بشكل نموذجي ، تتم مقارنة القيمة الاحتمالية بمستويات الأهمية المعيارية المقبولة عمومًا والتي تبلغ 0.005 أو 0.01.

على سبيل المثال ، إذا كانت قيمة إحصاء الاختبار المحسوبة من العينة تتوافق مع p = 0.005 ، فهذا يشير إلى احتمال 0.5٪ من صحة الفرضية. وبالتالي ، كلما كانت قيمة p أصغر ، كان ذلك أفضل ، لأنها تزيد من "قوة" رفض الفرضية الصفرية وتزيد من الأهمية المتوقعة للنتيجة.

شرح حبري مثير للاهتمام لهذا الأمر.

بدأ التحليل الإحصائي في الظهور كصندوق أسود: المدخلات عبارة عن بيانات ، والمخرجات عبارة عن جدول للنتائج الرئيسية وقيمة p.

ماذا تقول القيمة p؟

لنفترض أننا قررنا معرفة ما إذا كانت هناك علاقة بين الإدمان على ألعاب الكمبيوتر الدموية والعدوانية في الحياة الواقعية. لهذا ، تم تشكيل مجموعتين من تلاميذ المدارس من 100 شخص بشكل عشوائي (المجموعة 1 - مشجعو الرماية ، المجموعة 2 - لا يلعبون ألعاب الكمبيوتر). على سبيل المثال ، يعمل عدد المعارك مع الأقران كمؤشر على العدوانية. في دراستنا التخيلية ، اتضح أن مجموعة مقامرتي تلاميذ المدارس تتعارض مع رفاقهم بشكل ملحوظ في كثير من الأحيان. ولكن كيف يمكننا معرفة مدى أهمية الفروق الناتجة إحصائيًا؟ ربما حصلنا على الاختلاف الملحوظ عن طريق الصدفة؟ للإجابة على هذه الأسئلة ، يتم استخدام القيمة p - وهذا هو احتمال الحصول على مثل هذه الاختلافات الواضحة أو أكثر ، بشرط عدم وجود اختلافات في الواقع بين عامة السكان. بمعنى آخر ، هذا هو احتمال حدوث مثل هذه الاختلافات أو حتى أقوى بين مجموعاتنا ، بشرط ألا تؤثر ألعاب الكمبيوتر في الواقع على العدوانية بأي شكل من الأشكال. لا يبدو الأمر بهذه الصعوبة. ومع ذلك ، غالبًا ما يُساء تفسير هذه الإحصائية الخاصة.

أمثلة على القيمة p

لذلك ، قمنا بمقارنة مجموعتين من تلاميذ المدارس مع بعضهما البعض من حيث مستوى العدوانية باستخدام اختبار t القياسي (أو اختبار Chi غير المعياري - مربع الأكثر ملاءمة في هذه الحالة) ووجدنا أن p- المطلوب مستوى الأهمية أقل من 0.05 (على سبيل المثال ، 0.04). ولكن ما الذي تخبرنا به القيمة p الناتجة بالفعل؟ لذا ، إذا كانت القيمة p هي احتمال الحصول على مثل هذه الاختلافات الواضحة أو أكثر ، بشرط عدم وجود اختلافات في الواقع في عموم السكان ، فما رأيك في العبارة الصحيحة:

1. ألعاب الكمبيوتر هي سبب السلوك العدواني بنسبة احتمالية تصل إلى 96٪.
2. احتمال عدم وجود علاقة بين العدوانية وألعاب الكمبيوتر هو 0.04.
3. إذا حصلنا على مستوى p للدلالة أكبر من 0.05 ، فهذا يعني أن العدوانية وألعاب الكمبيوتر ليست مرتبطة بأي شكل من الأشكال.
4. احتمال الحصول على هذه الفروق بالصدفة هو 0.04.
5. كل البيانات خاطئة.

إذا اخترت الخيار الخامس ، فأنت محق تمامًا! ولكن ، كما تظهر العديد من الدراسات ، حتى الأشخاص الذين لديهم خبرة كبيرة في تحليل البيانات غالبًا ما يسيئون تفسير القيم الاحتمالية.

لنأخذ كل إجابة بالترتيب:

العبارة الأولى هي مثال على خطأ الارتباط: حقيقة أن متغيرين مرتبطين بشكل كبير لا تخبرنا شيئًا عن السبب والنتيجة. ربما يكون الأشخاص الأكثر عدوانية هم الذين يفضلون قضاء الوقت في لعب ألعاب الكمبيوتر ، وليست ألعاب الكمبيوتر هي التي تجعل الناس أكثر عدوانية.

هذا بيان أكثر إثارة للاهتمام. الشيء هو أننا نعتبر في البداية أنه لا توجد اختلافات في الواقع. ومع أخذ ذلك في الاعتبار كحقيقة ، نحسب القيمة الاحتمالية. لذلك ، فإن التفسير الصحيح هو: "بافتراض أن العدوانية وألعاب الكمبيوتر ليست مرتبطة بأي شكل من الأشكال ، فإن احتمال حدوث مثل هذه الاختلافات أو حتى أكثر وضوحًا هو 0.04".

لكن ماذا لو حصلنا على اختلافات طفيفة؟ هل يعني ذلك عدم وجود علاقة بين المتغيرات المدروسة؟ لا ، هذا يعني فقط أنه قد تكون هناك اختلافات ، لكن نتائجنا لم تسمح لنا باكتشافها.

يرتبط هذا ارتباطًا مباشرًا بتعريف القيمة الاحتمالية نفسها. 0.04 هو احتمال الحصول على هذه الاختلافات أو حتى أكثر تطرفاً. من حيث المبدأ ، من المستحيل تقدير احتمالية الحصول على مثل هذه الاختلافات بالضبط كما في تجربتنا!

هذه هي المزالق التي يمكن إخفاؤها في تفسير مثل هذا المؤشر مثل القيمة الاحتمالية. لذلك ، من المهم للغاية فهم الآليات التي تقوم عليها طرق التحليل وحساب المؤشرات الإحصائية الرئيسية.

كيف تجد قيمة p؟

1. تحديد النتائج المتوقعة لتجربتك

عادة ، عندما يقوم العلماء بإجراء تجربة ، يكون لديهم بالفعل فكرة عن النتائج التي يجب اعتبارها "طبيعية" أو "نموذجية". قد يعتمد هذا على النتائج التجريبية للتجارب السابقة ، أو على مجموعات بيانات موثوقة ، أو على بيانات من الأدبيات العلمية ، أو قد يعتمد العالم على بعض المصادر الأخرى. بالنسبة لتجربتك ، حدد النتائج المتوقعة ، وعبر عنها كأرقام.

مثال: على سبيل المثال ، أظهرت دراسات سابقة أنه في بلدك ، من المرجح أن تحصل السيارات الحمراء على تذاكر تجاوز السرعة أكثر من السيارات الزرقاء. على سبيل المثال ، يُظهر متوسط ​​الدرجات تفضيل 2: 1 للسيارات الحمراء على الزرقاء. نريد تحديد ما إذا كانت الشرطة لديها نفس التحيز ضد لون السيارات في مدينتك. للقيام بذلك ، سنقوم بتحليل الغرامات الصادرة عن السرعة. إذا أخذنا مجموعة عشوائية من 150 بطاقة مسرعة تم إصدارها لسيارات حمراء أو زرقاء ، فإننا نتوقع إصدار 100 تذكرة للسيارات الحمراء و 50 إلى الزرقاء إذا كانت الشرطة في مدينتنا منحازة نحو لون السيارات كما لوحظ هذا عبر البلد.

2. تحديد النتائج الملحوظة لتجربتك

الآن بعد أن حددت النتائج المتوقعة ، تحتاج إلى التجربة والعثور على القيم الفعلية (أو "الملاحظة"). تحتاج مرة أخرى إلى تمثيل هذه النتائج كأرقام. إذا أنشأنا ظروفًا تجريبية ، وكانت النتائج المرصودة مختلفة عن تلك المتوقعة ، فسيكون لدينا احتمالان - إما حدث هذا عن طريق الصدفة ، أو حدث هذا تحديدًا بسبب تجربتنا. الغرض من العثور على القيمة p هو تحديد ما إذا كانت النتائج المرصودة تختلف عن النتائج المتوقعة بحيث لا يمكن رفض "الفرضية الصفرية" - الفرضية القائلة بعدم وجود علاقة بين المتغيرات التجريبية والمتغيرات الملاحظة النتائج.

مثال: على سبيل المثال ، في مدينتنا ، اخترنا عشوائيًا 150 تذكرة سرعة تم إصدارها إما لسيارات حمراء أو زرقاء. قررنا أنه تم إصدار 90 تذكرة لسيارات حمراء و 60 بطاقة زرقاء. هذا يختلف عن النتائج المتوقعة ، وهي 100 و 50 على التوالي. هل أدت تجربتنا (في هذه الحالة ، تغيير مصدر البيانات من وطني إلى حضري) إلى هذا التغيير في النتائج ، أم أن شرطة مدينتنا متحيزة تمامًا بنفس الطريقة مثل المتوسط ​​الوطني ونرى فقط تباينًا عشوائيًا؟ ستساعدنا القيمة p في تحديد ذلك.

3. تحديد عدد درجات الحرية لتجربتك

عدد درجات الحرية هو درجة التباين في تجربتك ، والتي يتم تحديدها من خلال عدد الفئات التي تستكشفها. معادلة عدد درجات الحرية هي عدد درجات الحرية = n-1 ، حيث "n" هو عدد الفئات أو المتغيرات التي تقوم بتحليلها في تجربتك.

مثال: في تجربتنا ، هناك فئتان من النتائج: فئة واحدة للسيارات الحمراء ، والأخرى للسيارات الزرقاء. لذلك ، في تجربتنا ، لدينا 2-1 = 1 درجة من الحرية. إذا كنا نقارن السيارات ذات اللون الأحمر والأزرق والأخضر ، فسنحصل على درجتين من الحرية ، وهكذا.

4. قارن النتائج المتوقعة والملاحظة باستخدام اختبار كاي سكوير

Chi-square (المكتوبة "x2") هي قيمة عددية تقيس الفرق بين القيم المتوقعة والقيم الملاحظة للتجربة. معادلة مربع كاي هي x2 = Σ ((o-e) 2 / e) حيث "o" هي القيمة المرصودة و "e" هي القيمة المتوقعة. اجمع نتائج المعادلة المعطاة لجميع النتائج المحتملة (انظر أدناه).

لاحظ أن هذه المعادلة تتضمن عامل الجمع Σ (سيغما). بمعنى آخر ، تحتاج إلى حساب ((| o-e | -.05) 2 / e) لكل نتيجة محتملة ، وإضافة الأرقام معًا للحصول على قيمة مربع كاي. في مثالنا ، لدينا نتيجتان محتملتان - إما أن تكون السيارة التي حصلت على العقوبة حمراء أو زرقاء. لذلك علينا أن نحسب ((o-e) 2 / e) مرتين - مرة للسيارات الحمراء ، ومرة ​​للسيارات الزرقاء.

مثال: دعنا نعوض بالقيم المتوقعة والملاحظة في المعادلة x2 = Σ ((o-e) 2 / e). تذكر أنه بسبب عامل الجمع ، نحتاج إلى حساب ((o-e) 2 / e) مرتين - مرة للسيارات الحمراء ومرة ​​للسيارات الزرقاء. سوف نجعل هذا العمل على النحو التالي:
x2 = ((90-100) 2/100) + (60-50) 2/50)
x2 = ((-10) 2/100) + (10) 2/50)
x2 = (100/100) + (100/50) = 1 + 2 = 3.

5. اختر مستوى الأهمية

الآن بعد أن عرفنا عدد درجات الحرية في تجربتنا ، وعرفنا قيمة اختبار مربع كاي ، علينا فعل شيء آخر قبل أن نتمكن من إيجاد القيمة الاحتمالية. نحن بحاجة إلى تحديد مستوى الأهمية. تتحدث لغة بسيطة، يشير مستوى الأهمية إلى مدى ثقتنا في نتائجنا. تتوافق القيمة المنخفضة للأهمية مع احتمال ضئيل للحصول على النتائج التجريبية بالصدفة ، والعكس صحيح. تتم كتابة مستويات الأهمية ككسور عشرية (مثل 0.01) ، وهو ما يتوافق مع احتمال حصولنا على النتائج التجريبية بالصدفة (في هذه الحالة ، يكون احتمال أن يكون 1٪).

وفقًا للاتفاقية ، حدد العلماء عادةً مستوى أهمية تجاربهم على 0.05 أو 5٪. وهذا يعني أنه لا يمكن الحصول على النتائج التجريبية التي تفي بمعيار الأهمية هذا إلا باحتمال 5٪ بالصدفة البحتة. بعبارة أخرى ، هناك احتمال بنسبة 95٪ أن تكون النتائج ناجمة عن كيفية تعامل العالم مع المتغيرات التجريبية ، وليس عن طريق الصدفة. بالنسبة لمعظم التجارب ، فإن الثقة بنسبة 95٪ بوجود علاقة بين متغيرين كافية لاعتبار أنهما مرتبطان "حقًا" ببعضهما البعض.

مثال: بالنسبة لمثالنا الخاص بالسيارات ذات اللون الأحمر والأزرق ، دعنا نتبع الاتفاقية بين العلماء ونضبط مستوى الأهمية على 0.05.

6. استخدم ورقة بيانات توزيع مربع كاي للعثور على القيمة الاحتمالية

يستخدم العلماء والإحصائيون جداول بيانات كبيرة لحساب القيمة الاحتمالية لتجاربهم. تحتوي بيانات الجدول عادةً على محور عمودي على اليسار ، يتوافق مع عدد درجات الحرية ، ومحور أفقي في الأعلى ، مطابق للقيمة p. استخدم البيانات الموجودة في الجدول للعثور أولاً على عدد درجات الحرية ، ثم انظر إلى سلسلتك من اليسار إلى اليمين حتى تجد القيمة الأولى أكبر من قيمة مربع كاي. انظر إلى القيمة p المقابلة في الجزء العلوي من العمود الخاص بك. تقع قيمة p الخاصة بك بين هذا الرقم والعدد التالي (الذي على يسار رقمك).

يمكن الحصول على جداول توزيع مربع كاي من عدة مصادر (هنا يمكنك العثور على واحد على هذا الرابط).

مثال: كانت قيمة مربع كاي 3. نظرًا لأننا نعلم أن هناك درجة واحدة فقط من الحرية في تجربتنا ، فسنختار الصف الأول. ننتقل من اليسار إلى اليمين على طول هذا الخط حتى نواجه قيمة أكبر من 3 ، قيمة اختبار مربع كاي. أول واحد نجده هو 3.84. بالبحث عن عمودنا ، نرى أن القيمة p المقابلة هي 0.05. هذا يعني أن قيمة p الخاصة بنا تقع بين 0.05 و 0.1 (ثاني أعلى قيمة p في الجدول).

7. قرر ما إذا كنت سترفض فرضيتك الصفرية أو تحتفظ بها

نظرًا لأنك حددت القيمة الاحتمالية التقريبية لتجربتك ، فأنت بحاجة إلى تحديد ما إذا كنت سترفض الفرضية الصفرية لتجربتك أم لا (تذكر ، هذه هي الفرضية القائلة بأن المتغيرات التجريبية التي تعاملت معها لم تؤثر على النتائج التي لاحظتها). إذا كانت قيمة p أقل من مستوى الأهمية لديك ، فتهانينا ، لقد أثبتت أن هناك علاقة محتملة جدًا بين المتغيرات التي قمت بالتلاعب بها والنتائج التي لاحظتها. إذا كانت قيمة p الخاصة بك أعلى من مستوى الأهمية لديك ، فلا يمكنك التأكد مما إذا كانت النتائج التي لاحظتها ناتجة عن فرصة خالصة أو تلاعب بمتغيراتك.

مثال: القيمة الاحتمالية الخاصة بنا تتراوح بين 0.05 و 0.1. من الواضح أن هذا لا يقل عن 0.05 ، لذلك للأسف لا يمكننا رفض فرضيتنا الصفرية. هذا يعني أننا لم نصل إلى حد أدنى من احتمال 95٪ للقول إن الشرطة في مدينتنا تصدر تذاكر لسيارات حمراء وزرقاء باحتمال مختلف تمامًا عن المعدل الوطني.

بعبارة أخرى ، هناك احتمال بنسبة 5-10٪ أن النتائج التي نلاحظها ليست نتائج تغيير في الموقع (تحليل المدينة ، وليس البلد بأكمله) ، بل مجرد حادث. نظرًا لأننا طلبنا دقة أقل من 5٪ ، لا يمكننا القول إننا على يقين من أن الشرطة في مدينتنا أقل تحيزًا تجاه السيارات الحمراء - هناك فرصة صغيرة (ولكنها ذات دلالة إحصائية) بأن الأمر ليس كذلك.

في جداول نتائج الحسابات الإحصائية في أوراق الفصل الدراسي وأطروحات الدبلوم والماجستير في علم النفس ، يوجد دائمًا مؤشر "p".

على سبيل المثال ، وفقًا لـ أهداف البحثتم حساب الفروق في مستوى معنى الحياة عند الأولاد والبنات في سن المراهقة.

يعني

اختبار Mann-Whitney U.

مستوى الدلالة الإحصائية (ع)

أولاد (20 شخصا)

فتيات

(5 أشخاص)

الأهداف

28,9

35,2

17,5

0,027*

معالجة

30,1

32,0

38,5

0,435

نتيجة

25,2

29,0

29,5

0,164

مركز التحكم - "أنا"

20,3

23,6

0,067

مركز التحكم - "الحياة"

30,4

33,8

27,5

0,126

معنى الحياة

98,9

111,2

0,103

* - الفروق ذات دلالة إحصائية (ص0,05)

يشير العمود الأيمن إلى قيمة "p" ومن خلال قيمتها يمكن للمرء تحديد ما إذا كانت الاختلافات في معنى الحياة في المستقبل لدى الأولاد والبنات كبيرة أم غير مهمة. القاعدة بسيطة:

  • إذا كان مستوى الدلالة الإحصائية "p" أقل من أو يساوي 0.05 ، فإننا نستنتج أن الفروق ذات دلالة إحصائية. في الجدول أعلاه ، الاختلافات بين الفتيان والفتيات كبيرة فيما يتعلق بمؤشر "الأهداف" - معنى الحياة في المستقبل. في الفتيات ، يكون هذا المؤشر أعلى بكثير من الناحية الإحصائية منه عند الأولاد.
  • إذا كان مستوى الدلالة الإحصائية "p" أكبر من 0.05 ، فيستنتج أن الفروق ليست ذات دلالة إحصائية. في الجدول أعلاه ، الفروق بين الفتيان والفتيات ليست ذات دلالة بالنسبة لجميع المؤشرات الأخرى ، باستثناء المؤشر الأول.

من أين يأتي مستوى الدلالة الإحصائية "p"

يتم حساب مستوى الدلالة الإحصائية برنامج إحصائيمع حساب المعيار الإحصائي. في هذه البرامج ، يمكنك أيضًا تعيين حد حرج لمستوى الأهمية الإحصائية وسيتم إبراز المؤشرات المقابلة بواسطة البرنامج.

على سبيل المثال ، في برنامج STATISTICA ، عند حساب الارتباطات ، يمكنك تعيين حد p ، على سبيل المثال ، 0.05 ، وسيتم تمييز جميع العلاقات ذات الدلالة الإحصائية باللون الأحمر.

إذا تم حساب المعيار الإحصائي يدويًا ، يتم تحديد مستوى الأهمية "p" بمقارنة قيمة المعيار الذي تم الحصول عليه مع القيمة الحرجة.

ماذا يظهر مستوى الدلالة الإحصائية "p"

جميع الحسابات الإحصائية تقريبية. يحدد مستوى هذا التقريب "r". تتم كتابة مستوى الأهمية في صورة كسور عشرية ، على سبيل المثال ، 0.023 أو 0.965. إذا ضربنا هذا الرقم في 100 ، نحصل على مؤشر p كنسبة مئوية: 2.3٪ و 96.5٪. تعكس هذه النسب المئوية احتمال خطأ افتراضنا بوجود علاقة ، على سبيل المثال ، بين العدوانية والقلق.

هذا هو، معامل الارتباطتم الحصول على 0.58 بين العدوانية والقلق عند مستوى دلالة إحصائية 0.05 أو احتمال خطأ 5٪. ماذا يعني حقا هذا؟

الارتباط الذي وجدناه يعني أن النمط التالي لوحظ في عينتنا: كلما زادت العدوانية ، زاد القلق. أي ، إذا أخذنا مراهقين ، وكان أحدهما يعاني من قلق أكبر من الآخر ، فعند معرفة العلاقة الإيجابية ، يمكننا القول أن هذا المراهق سيكون لديه أيضًا عدوانية أعلى. ولكن نظرًا لأن كل شيء تقريبي في الإحصاء ، فعندما نقول ذلك ، نعترف بأنه يمكننا ارتكاب خطأ ، واحتمال حدوث خطأ هو 5٪. أي بعد إجراء 20 مقارنات من هذا القبيل في هذه المجموعة من المراهقين ، يمكننا أن نخطئ في التنبؤ بمستوى العدوانية مرة واحدة ، مع العلم بالقلق.

أي مستوى للدلالة الإحصائية أفضل: 0.01 أو 0.05

يعكس مستوى الدلالة الإحصائية احتمال الخطأ. لذلك ، تكون النتيجة عند p = 0.01 أكثر دقة مما كانت عليه عند p = 0.05.

في البحث النفسي ، يتم قبول مستويين مقبولين للدلالة الإحصائية للنتائج:

ع = 0.01 - موثوقية عالية للنتيجة تحليل مقارنأو تحليل العلاقات ؛

ع = 0.05 - دقة كافية.

آمل أن تساعدك هذه المقالة في كتابة ورقة علم نفس بنفسك. إذا كنت بحاجة إلى مساعدة ، يرجى الاتصال (جميع أنواع العمل في علم النفس ؛ الحسابات الإحصائية).