تحليل الانحدار. تحليل الانحدار

يفحص تحليل الانحدار اعتماد كمية معينة على كمية أخرى أو عدة كميات أخرى. يستخدم تحليل الانحدار بشكل أساسي في التنبؤ على المدى المتوسط ​​، وكذلك في التنبؤ على المدى الطويل. تتيح الفترات المتوسطة والطويلة الأجل إجراء تغييرات في بيئة الأعمال ومراعاة تأثير هذه التغييرات على المؤشر قيد الدراسة.

لإجراء تحليل الانحدار ، من الضروري:

    توافر البيانات السنوية عن المؤشرات المدروسة ،

    توافر تنبؤات لمرة واحدة ، أي التوقعات التي لا تتحسن مع البيانات الجديدة.

عادةً ما يتم إجراء تحليل الانحدار للأشياء التي لها طبيعة معقدة ومتعددة العوامل ، مثل حجم الاستثمارات والأرباح وحجم المبيعات وما إلى ذلك.

في طريقة التنبؤ المعيارييتم تحديد طرق وشروط تحقيق الحالات المحتملة للظاهرة ، التي تم اتخاذها كهدف. نحن نتحدث عن توقع تحقيق الدول المرغوبة للظاهرة على أساس معايير ومثل وحوافز وأهداف محددة سلفًا. يجيب مثل هذا التوقع على السؤال: ما هي الطرق التي يمكن بها تحقيق المطلوب؟ غالبًا ما تُستخدم الطريقة المعيارية للتنبؤات المبرمجة أو المستهدفة. يتم استخدام كل من التعبير الكمي للمعيار ومقياس معين لإمكانيات وظيفة التقييم.

في حالة استخدام تعبير كمي ، على سبيل المثال ، المعايير الفسيولوجية والعقلانية لاستهلاك بعض المنتجات الغذائية وغير الغذائية التي وضعها متخصصون لمجموعات مختلفة من السكان ، فمن الممكن تحديد مستوى استهلاك هذه السلع من أجل السنوات التي سبقت تحقيق المعيار المحدد. تسمى هذه الحسابات الاستيفاء. الاستيفاء هو طريقة لحساب المؤشرات المفقودة في السلسلة الزمنية لظاهرة ما ، بناءً على علاقة راسخة. بأخذ القيمة الفعلية للمؤشر وقيمة معاييره كأعضاء متطرفين في السلسلة الديناميكية ، من الممكن تحديد حجم القيم ضمن هذه السلسلة. لذلك ، يعتبر الاستيفاء طريقة معيارية. يمكن استخدام الصيغة المعطاة سابقًا (4) ، المستخدمة في الاستقراء ، في الاستيفاء ، حيث لم يعد y n يميز البيانات الفعلية ، ولكن معيار المؤشر.

في حالة استخدام مقياس (مجال ، طيف) لإمكانيات وظيفة التقييم ، أي دالة توزيع التفضيل ، في الطريقة المعيارية ، يشار تقريبًا إلى التدرج التالي: غير مرغوب فيه - أقل استحسانًا - مرغوب فيه أكثر - مرغوب فيه أكثر - الأمثل (قياسي).

تساعد طريقة التنبؤ المعياري على وضع توصيات لزيادة مستوى الموضوعية ، وبالتالي فعالية القرارات.

النمذجة، ربما تكون أصعب طريقة للتنبؤ. النمذجة الرياضية تعني وصف ظاهرة اقتصادية من خلال الصيغ الرياضية والمعادلات وعدم المساواة. يجب أن يعكس الجهاز الرياضي بدقة خلفية التنبؤ ، على الرغم من أنه من الصعب جدًا أن تعكس بالكامل عمق وتعقيد الكائن المتوقع. مصطلح "نموذج" مشتق من الكلمة اللاتينية modelus ، والتي تعني "قياس". لذلك ، سيكون من الأصح اعتبار النمذجة ليس كطريقة للتنبؤ ، ولكن كطريقة لدراسة ظاهرة مماثلة على نموذج.

بمعنى واسع ، تسمى النماذج بدائل موضوع الدراسة ، والتي تتشابه معها مما يسمح لك بالحصول على معرفة جديدة حول الكائن. يجب اعتبار النموذج وصفًا رياضيًا للكائن. في هذه الحالة ، يتم تعريف النموذج على أنه ظاهرة (موضوع ، تثبيت) تكون في بعض المراسلات مع الكائن قيد الدراسة ويمكن أن تحل محلها في عملية البحث ، وتقديم معلومات حول الكائن.

مع فهم أضيق للنموذج ، يُعتبر هدفًا للتنبؤ ، تسمح دراسته بالحصول على معلومات حول الحالات المحتملة للكائن في المستقبل وطرق تحقيق هذه الحالات. في هذه الحالة ، الغرض من النموذج التنبئي هو الحصول على معلومات ليس عن الكائن بشكل عام ، ولكن فقط حول حالاته المستقبلية. بعد ذلك ، عند بناء نموذج ، قد يكون من المستحيل التحقق مباشرة من تطابقه مع الكائن ، لأن النموذج يمثل حالته المستقبلية فقط ، وقد يكون الكائن نفسه غائبًا حاليًا أو له وجود مختلف.

يمكن أن تكون النماذج مادية ومثالية.

تستخدم النماذج المثالية في علم الاقتصاد. النموذج الأكثر مثالية لوصف كمي لظاهرة اجتماعية اقتصادية (اقتصادية) هو نموذج رياضي يستخدم الأرقام أو الصيغ أو المعادلات أو الخوارزميات أو التمثيل الرسومي. بمساعدة النماذج الاقتصادية ، حدد:

    العلاقة بين المؤشرات الاقتصادية المختلفة ؛

    أنواع مختلفة من القيود المفروضة على المؤشرات ؛

    معايير لتحسين العملية.

يمكن تمثيل وصف ذي مغزى لكائن ما في شكل مخططه الرسمي ، والذي يشير إلى المعلمات والمعلومات الأولية التي يجب جمعها من أجل حساب القيم المطلوبة. يحتوي النموذج الرياضي ، على عكس المخطط الرسمي ، على بيانات عددية محددة تميز كائنًا.يعتمد تطوير نموذج رياضي إلى حد كبير على فكرة المتنبئ عن جوهر العملية التي يتم نمذجتها. بناءً على أفكاره ، قام بطرح فرضية عمل ، يتم من خلالها إنشاء سجل تحليلي للنموذج في شكل صيغ ومعادلات وعدم مساواة. نتيجة لحل نظام المعادلات ، يتم الحصول على معلمات محددة للوظيفة ، والتي تصف التغيير في المتغيرات المرغوبة بمرور الوقت.

يتم تحديد ترتيب وتسلسل العمل كعنصر من عناصر تنظيم التنبؤ اعتمادًا على طريقة التنبؤ المستخدمة. عادة يتم تنفيذ هذا العمل على عدة مراحل.

المرحلة 1 - الاسترجاع التنبئي ، أي إنشاء كائن التنبؤ وخلفية التنبؤ. يتم تنفيذ العمل في المرحلة الأولى بالتسلسل التالي:

    تكوين وصف لشيء ما في الماضي ، والذي يتضمن تحليلًا مسبقًا للكائن ، وتقييمًا لمعاييره وأهميته وعلاقاته المتبادلة ،

    تحديد وتقييم مصادر المعلومات ، وإجراءات وتنظيم العمل معهم ، وجمع المعلومات بأثر رجعي ووضعها ؛

    تحديد أهداف البحث.

عند أداء مهام الاسترجاع التنبئي ، يدرس المتنبئون تاريخ تطور الكائن وخلفية التنبؤ من أجل الحصول على وصفهم المنهجي.

المرحلة 2 - التشخيص التنبئي ، يتم خلالها دراسة وصف منهجي لهدف التنبؤ وخلفية التنبؤ من أجل تحديد الاتجاهات في تطورها واختيار النماذج وطرق التنبؤ. يتم تنفيذ العمل بالتسلسل التالي:

    تطوير نموذج كائن تنبؤ ، بما في ذلك وصف رسمي للكائن ، والتحقق من درجة ملاءمة النموذج للكائن ؛

    اختيار طرق التنبؤ (الرئيسية والإضافية) ، وتطوير الخوارزمية وبرامج العمل.

المرحلة الثالثة - الرعاية ، أي عملية التطوير المكثف للتنبؤ ، بما في ذلك: 1) حساب المعلمات المتوقعة لفترة زمنية معينة ؛ 2) توليف المكونات الفردية للتنبؤ.

المرحلة الرابعة - تقييم التوقعات ، بما في ذلك التحقق منها ، أي تحديد درجة الموثوقية والدقة والصلاحية.

في سياق التنقيب والتقييم ، يتم حل مهام التنبؤ وتقييمها على أساس المراحل السابقة.

المرحلة المشار إليها تقريبية وتعتمد على طريقة التنبؤ الرئيسية.

يتم وضع نتائج التنبؤ في شكل شهادة أو تقرير أو مادة أخرى ويتم تقديمها إلى العميل.

في التنبؤ ، يمكن الإشارة إلى انحراف التنبؤ عن الحالة الفعلية للكائن ، وهو ما يسمى خطأ التنبؤ ، والذي يتم حسابه بواسطة الصيغة:

;
;
. (9.3)

مصادر الأخطاء في التنبؤ

يمكن أن تكون المصادر الرئيسية:

1. النقل البسيط (الاستقراء) للبيانات من الماضي إلى المستقبل (على سبيل المثال ، ليس لدى الشركة خيارات أخرى للتنبؤ ، باستثناء زيادة بنسبة 10٪ في المبيعات).

2. عدم القدرة على التحديد الدقيق لاحتمال وقوع حدث وتأثيره على الشيء قيد الدراسة.

3. صعوبات غير متوقعة (أحداث تخريبية) تؤثر على تنفيذ الخطة ، مثل الفصل المفاجئ لرئيس قسم المبيعات.

بشكل عام ، تزداد دقة التنبؤ مع تراكم الخبرة في التنبؤ وتطوير أساليبها.

تحليل الانحدار

تراجع (خطي) التحليلات- طريقة إحصائية لدراسة تأثير واحد أو أكثر من المتغيرات المستقلة على متغير تابع. تُسمى المتغيرات المستقلة بـ Regressors أو المتنبئين ، وتسمى المتغيرات التابعة المعايير. المصطلح يعتمدو لا يعتمدالمتغيرات تعكس فقط الاعتماد الرياضي للمتغيرات ( انظر الارتباط الزائف) ، وليس علاقة سببية.

أهداف تحليل الانحدار

  1. تحديد درجة حتمية اختلاف المعيار (التابع) المتغير بواسطة المتنبئين (المتغيرات المستقلة)
  2. توقع قيمة المتغير التابع باستخدام المتغير (المتغيرات) المستقلة
  3. تحديد مساهمة المتغيرات الفردية المستقلة في تباين التابع

لا يمكن استخدام تحليل الانحدار لتحديد ما إذا كانت هناك علاقة بين المتغيرات ، لأن وجود مثل هذه العلاقة يعد شرطًا أساسيًا لتطبيق التحليل.

التعريف الرياضي للانحدار

يمكن تعريف الاعتماد التراجعي الصارم على النحو التالي. لنكن متغيرات عشوائية مع توزيع احتمالي مشترك معين. إذا تم تحديد توقع شرطي لكل مجموعة من القيم

(معادلة الانحدار العام) ،

ثم يتم استدعاء الوظيفة تراجعقيم ص بالقيم ، والرسم البياني الخاص بها - خط الانحداربواسطة ، أو معادلة الانحدار.

يتجلى الاعتماد على في التغيير في متوسط ​​قيم Y عند التغيير. على الرغم من أنه بالنسبة لكل مجموعة قيم ثابتة ، تظل الكمية متغيرًا عشوائيًا مع تشتت معين.

لتوضيح السؤال حول مدى دقة تحليل الانحدار في تقدير التغيير في Y مع التغيير ، يتم استخدام متوسط ​​قيمة التباين Y لمجموعات مختلفة من القيم (في الواقع ، نحن نتحدث عن مقياس تشتت متغير تابع حول خط الانحدار).

طريقة المربعات الصغرى (حساب المعاملات)

في الممارسة العملية ، غالبًا ما يتم البحث عن خط الانحدار في النموذج دالة خطية(الانحدار الخطي) الذي يقترب بشكل أفضل من المنحنى المطلوب. يتم ذلك باستخدام طريقة المربعات الصغرى ، عندما يتم تقليل مجموع الانحرافات التربيعية لما تمت ملاحظته بالفعل من تقديراتهم (بمعنى التقديرات باستخدام خط مستقيم يدعي أنه يمثل تبعية الانحدار المطلوبة):

(م - حجم العينة). هذا النهج يعتمد على حقيقة معروفةأن المجموع الذي يظهر في التعبير أعلاه يأخذ الحد الأدنى من القيمة على وجه التحديد للحالة عندما.

لحل مشكلة تحليل الانحدار بطريقة المربعات الصغرى ، تم تقديم المفهوم الوظائف المتبقية:

شرط الحد الأدنى من الوظيفة المتبقية:

النظام الناتج هو النظام المعادلات الخطيةمع مجهول

إذا كنا نمثل الحدود الحرة للطرف الأيسر من المعادلات بالمصفوفة

ومعاملات المجهول على الجانب الأيمن من المصفوفة

ثم نحصل على معادلة المصفوفة: والتي يتم حلها بسهولة بطريقة Gauss. ستكون المصفوفة الناتجة عبارة عن مصفوفة تحتوي على معاملات معادلة خط الانحدار:

للحصول على أفضل التقديرات ، من الضروري تلبية متطلبات LSM (شروط Gauss-Markov). في الأدب الإنجليزي ، تسمى هذه التقديرات BLUE (أفضل التقديرات الخطية غير المتحيزة) - أفضل التقديرات الخطية غير المتحيزة.

تفسير معاملات الانحدار

المعلمات هي معاملات الارتباط الجزئي ؛ يتم تفسيره على أنه نسبة تباين Y الموضح من خلال تحديد تأثير المتنبئين المتبقيين ، أي أنه يقيس المساهمة الفردية في تفسير Y. في حالة المتنبئين المتصلين ، هناك مشكلة عدم اليقين في التقديرات ، والتي تصبح معتمدة على الترتيب الذي يتم به تضمين المتنبئين في النموذج. في مثل هذه الحالات ، من الضروري تطبيق طرق تحليل الارتباط وتحليل الانحدار التدريجي.

عند الحديث عن النماذج غير الخطية لتحليل الانحدار ، من المهم الانتباه إلى ما إذا كنا نتحدث عن اللاخطية في المتغيرات المستقلة (من وجهة نظر رسمية ، يمكن تقليلها بسهولة إلى الانحدار الخطي) ، أو عدم الخطية في المعلمات المقدرة (يسبب صعوبات حسابية خطيرة). مع النوع الأول من اللاخطية ، من وجهة نظر ذات مغزى ، من المهم تحديد المظهر في نموذج أعضاء النموذج ، مما يشير إلى وجود تفاعلات بين الميزات ، وما إلى ذلك (انظر تعدد الخطوط الخطية).

أنظر أيضا

الروابط

  • www.kgafk.ru - محاضرة عن "تحليل الانحدار"
  • www.basegroup.ru - طرق اختيار المتغيرات في نماذج الانحدار

المؤلفات

  • نورمان دريبر وهاري سميثتحليل الانحدار التطبيقي. الانحدار المتعدد= تحليل الانحدار التطبيقي. - الطبعة الثالثة. - م: "ديالكتيك" ، 2007. - ص 912. - ردمك 0-471-17082-8
  • الطرق المستدامة لتقدير النماذج الإحصائية: دراسة. - K.: PP "Sansparelle"، 2005. - S. 504. - ISBN 966-96574-0-7، UDC: 519.237.5: 515.126.2، LBC 22.172 + 22.152
  • رادشينكو ستانيسلاف جريجوريفيتش ،منهجية تحليل الانحدار: دراسة. - ك: "Korniychuk" ، 2011. - S. 376. - ISBN 978-966-7599-72-0

مؤسسة ويكيميديا. 2010.

ما هو الانحدار؟

ضع في اعتبارك متغيرين مستمرين س = (س 1 ، س 2 ، .. ، س ن) ، ص = (ص 1 ، ص 2 ، ... ، ص ن).

لنضع النقاط على مخطط تبعثر ثنائي الأبعاد ونفترض أن لدينا علاقة خطيةإذا تم تقريب البيانات بخط مستقيم.

إذا افترضنا ذلك ذيعتمد على xوالتغييرات في ذبسبب التغييرات في x، يمكننا تحديد خط الانحدار (الانحدار ذعلى ال x) ، وهو أفضل وصف للعلاقة المستقيمة بين هذين المتغيرين.

يأتي الاستخدام الإحصائي لكلمة "الانحدار" من ظاهرة تعرف باسم الانحدار إلى المتوسط ​​، منسوبة إلى السير فرانسيس جالتون (1889).

أظهر أنه بينما يميل الآباء الطويلون إلى أن يكون لديهم أبناء طويلي القامة ، فإن متوسط ​​قامة الأبناء أصغر من متوسط ​​قامة آبائهم. متوسط ​​ارتفاع الأبناء "تراجع" و "عائدون" إلى متوسط ​​ارتفاع جميع الآباء في السكان. وهكذا ، في المتوسط ​​، الآباء طويل القامة لديهم أبناء أقصر (لكن لا يزالون طوال القامة) ، والآباء قصار القامة لديهم أبناء أطول (لكن لا يزالون أقصر).

خط الانحدار

معادلة رياضية تقيم خط انحدار خطي بسيط (زوجي):

xيسمى المتغير المستقل أو المتنبئ.

صهو المتغير التابع أو متغير الاستجابة. هذه هي القيمة التي نتوقعها ذ(في المتوسط) إذا عرفنا القيمة x، بمعنى آخر. هي القيمة المتوقعة ذ»

  • أ- عضو مجاني (عبور) لخط التقييم ؛ هذه القيمة ص، متى س = 0(رسم بياني 1).
  • ب- انحدار أو انحدار الخط المقدر ؛ هذا هو المبلغ الذي صيزيد في المتوسط ​​إذا زادنا xلوحدة واحدة.
  • أو بتسمى معاملات الانحدار للخط المقدر ، على الرغم من أن هذا المصطلح يستخدم غالبًا فقط ب.

يمكن تمديد الانحدار الخطي الزوجي ليشمل أكثر من متغير مستقل واحد ؛ في هذه الحالة يُعرف باسم الانحدار المتعدد.

رسم بياني 1. يُظهر خط الانحدار الخطي تقاطع a والمنحدر b (مقدار الزيادة في Y عندما تزيد x بمقدار وحدة واحدة)

طريقة المربعات الصغرى

نقوم بإجراء تحليل الانحدار باستخدام عينة من الملاحظات حيث أو ب- تقديرات العينة للمعلمات الحقيقية (العامة) ، α و ، والتي تحدد خط الانحدار الخطي في المجتمع (السكان العام).

أبسط طريقة لتحديد المعاملات أو بهو طريقة التربيع الصغرى(MNK).

يتم تقييم الملاءمة من خلال النظر في البقايا (المسافة العمودية لكل نقطة من الخط ، على سبيل المثال المتبقي = يمكن ملاحظته ذ- وتوقع ذ، أرز. 2).

يتم اختيار الخط الأنسب بحيث يكون مجموع مربعات القيم المتبقية ضئيلًا.

أرز. 2. خط الانحدار الخطي مع المخلفات المصورة (الخطوط المنقطة العمودية) لكل نقطة.

افتراضات الانحدار الخطي

لذلك ، لكل قيمة ملحوظة ، المتبقي يساوي الفرق والقيمة المتوقعة المقابلة ، ويمكن أن يكون كل متبقي موجبًا أو سالبًا.

يمكنك استخدام القيم المتبقية لاختبار الافتراضات التالية وراء الانحدار الخطي:

  • يتم توزيع المخلفات عادة بمتوسط ​​صفري ؛

إذا كانت افتراضات الخطية والطبيعية و / أو التباين الثابت موضع تساؤل ، فيمكننا تحويل أو حساب خط الانحدار الجديد الذي يتم استيفاء هذه الافتراضات من أجله (على سبيل المثال ، استخدم التحويل اللوغاريتمي ، وما إلى ذلك).

القيم الشاذة (القيم المتطرفة) ونقاط التأثير

ملاحظة "مؤثرة" ، إذا تم حذفها ، تغير واحدًا أو أكثر من تقديرات معلمات النموذج (أي الميل أو التقاطع).

يمكن أن تكون الملاحظة الخارجية (الملاحظة التي تتعارض مع معظم القيم الموجودة في مجموعة البيانات) ملاحظة "مؤثرة" ويمكن اكتشافها جيدًا بصريًا عند النظر إلى مخطط تشتت ثنائي الأبعاد أو مؤامرة من المخلفات.

لكل من القيم المتطرفة والملاحظات "المؤثرة" (النقاط) ، يتم استخدام النماذج ، سواء مع تضمينها أو بدونها ، مع الانتباه إلى التغيير في التقدير (معاملات الانحدار).

عند إجراء تحليل ، لا تتجاهل القيم المتطرفة أو تؤثر على النقاط تلقائيًا ، لأن تجاهلها ببساطة يمكن أن يؤثر على النتائج. احرص دائمًا على دراسة أسباب هذه القيم المتطرفة وتحليلها.

فرضية الانحدار الخطي

عند إنشاء انحدار خطي ، يتم التحقق من الفرضية الصفرية بأن المنحدر العام لخط الانحدار β يساوي صفرًا.

إذا كان ميل الخط صفرًا ، فلا توجد علاقة خطية بين و: لا يؤثر التغيير

لاختبار الفرضية الصفرية القائلة بأن الميل الحقيقي يساوي صفرًا ، يمكنك استخدام الخوارزمية التالية:

احسب إحصائية الاختبار المساوية للنسبة التي تخضع للتوزيع بدرجات الحرية ، حيث يكون الخطأ المعياري للمعامل


,

- تقدير التباين في المخلفات.

عادة ، إذا كان مستوى الأهمية الذي تم الوصول إليه هو الفرضية الصفرية.


أين هي النسبة المئوية للتوزيع بدرجات الحرية التي تعطي احتمالية اختبار ثنائي الطرف

هذا هو الفاصل الزمني الذي يحتوي على الميل العام مع احتمال 95٪.

بالنسبة للعينات الكبيرة ، لنفترض أنه يمكننا التقريب بقيمة 1.96 (أي أن إحصائية الاختبار تميل إلى التوزيع الطبيعي)

تقييم جودة الانحدار الخطي: معامل التحديد R 2

بسبب العلاقة الخطية ونتوقع أن يتغير ذلك كتغييرات ، ونسمي هذا الاختلاف الذي يرجع إلى الانحدار أو يفسره. يجب أن يكون التباين المتبقي صغيرًا قدر الإمكان.

إذا كان الأمر كذلك ، فسيتم تفسير معظم التباين من خلال الانحدار ، وستكون النقاط قريبة من خط الانحدار ، أي يناسب الخط البيانات جيدًا.

يتم استدعاء نسبة التباين الكلي الذي يفسره الانحدار معامل التحديد، يتم التعبير عنها عادةً كنسبة مئوية ومشار إليها R2(في الانحدار الخطي المقترن ، هذه هي القيمة r2، مربع معامل الارتباط) ، يسمح لك بالتقييم الذاتي لجودة معادلة الانحدار.

الفرق هو النسبة المئوية للتباين الذي لا يمكن تفسيره بالانحدار.

مع عدم وجود اختبار رسمي لتقييمه ، فإننا مضطرون إلى الاعتماد على الحكم الذاتي لتحديد جودة ملاءمة خط الانحدار.

تطبيق خط الانحدار على توقع

يمكنك استخدام خط الانحدار للتنبؤ بقيمة من قيمة ضمن النطاق الملحوظ (لا تستنبط أبدًا خارج هذه الحدود).

نتوقع متوسط ​​المراقبات التي لها قيمة معينة عن طريق استبدال تلك القيمة في معادلة خط الانحدار.

لذلك ، إذا كنا نتوقع كما نستخدم هذه القيمة المتوقعة وخطأها المعياري لتقدير فاصل الثقة لمتوسط ​​المحتوى الحقيقي.

يتيح لك تكرار هذا الإجراء لقيم مختلفة بناء حدود ثقة لهذا الخط. هذا نطاق أو منطقة تحتوي على خط حقيقي ، على سبيل المثال ، بمستوى ثقة 95٪.

خطط الانحدار البسيطة

تحتوي تصميمات الانحدار البسيطة على متنبئ مستمر واحد. إذا كانت هناك 3 حالات ذات قيم توقع P ، مثل 7 و 4 و 9 ، وكان التصميم يشتمل على تأثير من الدرجة الأولى P ، فإن مصفوفة التصميم X ستكون

ويبدو أن معادلة الانحدار باستخدام P لـ X1

ص = ب 0 + ب 1 ص

إذا كان تصميم الانحدار البسيط يحتوي على تأثير ترتيب أعلى على P ، مثل تأثير تربيعي ، فسيتم رفع القيم الموجودة في العمود X1 في مصفوفة التصميم إلى القوة الثانية:

وستأخذ المعادلة الشكل

ص = ب 0 + ب 1 ف 2

لا تنطبق طرق الترميز المقيدة بالسيغما والمفرطة في المعامل على تصميمات الانحدار البسيطة والتصميمات الأخرى التي تحتوي على تنبؤات مستمرة فقط (لأنه ببساطة لا توجد تنبؤات فئوية). بغض النظر عن طريقة الترميز المختارة ، تزداد قيم المتغيرات المستمرة بالقوة المناسبة وتستخدم كقيم لمتغيرات X. في هذه الحالة ، لا يتم إجراء أي تحويل. بالإضافة إلى ذلك ، عند وصف خطط الانحدار ، يمكنك حذف اعتبار مصفوفة الخطة X ، والعمل فقط مع معادلة الانحدار.

مثال: تحليل الانحدار البسيط

يستخدم هذا المثال البيانات الواردة في الجدول:

أرز. 3. جدول البيانات الأولية.

تستند البيانات إلى مقارنة بين تعدادات 1960 و 1970 في 30 مقاطعة تم اختيارها عشوائياً. يتم تمثيل أسماء المقاطعات كأسماء ملاحظة. يتم عرض المعلومات المتعلقة بكل متغير أدناه:

أرز. 4. جدول مواصفات المتغير.

أهداف البحث

في هذا المثال ، سيتم تحليل العلاقة بين معدل الفقر والقوة التي تتنبأ بنسبة الأسر التي تقع تحت خط الفقر. لذلك ، سوف نتعامل مع المتغير 3 (Pt_Poor) كمتغير تابع.

يمكن للمرء أن يطرح فرضية: التغيير في عدد السكان ونسبة العائلات التي تقع تحت خط الفقر مرتبطان. يبدو من المعقول أن نتوقع أن الفقر يؤدي إلى تدفق السكان ، وبالتالي سيكون هناك علاقة سلبية بين النسبة المئوية للأشخاص تحت خط الفقر والتغير السكاني. لذلك ، سوف نتعامل مع المتغير 1 (Pop_Chng) كمتغير توقع.

عرض النتائج

معاملات الانحدار

أرز. 5. معاملات الانحدار Pt_Poor على Pop_Chng.

عند تقاطع صف Pop_Chng و Param. المعامل غير القياسي لانحدار Pt_Poor على Pop_Chng هو -0.40374. هذا يعني أنه مقابل كل وحدة انخفاض في عدد السكان ، هناك زيادة في معدل الفقر .40374. لا تشتمل حدود الثقة العلوية والسفلية (الافتراضية) البالغة 95٪ لهذا المعامل غير المعياري على صفر ، لذا فإن معامل الانحدار مهم عند المستوى p<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

توزيع المتغيرات

يمكن المبالغة في تقدير معاملات الارتباط أو التقليل من شأنها إذا كان هناك قيم متطرفة كبيرة في البيانات. دعونا نفحص توزيع المتغير التابع Pt_Poor حسب المقاطعة. للقيام بذلك ، سنقوم ببناء مدرج تكراري لمتغير Pt_Poor.

أرز. 6. رسم بياني لمتغير Pt_Poor.

كما ترى فإن توزيع هذا المتغير يختلف بشكل ملحوظ عن التوزيع الطبيعي. ومع ذلك ، على الرغم من أنه حتى المقاطعتين (العمودان الأيمنان) لديهما نسبة مئوية أعلى من العائلات التي تقع تحت خط الفقر أكثر مما هو متوقع في التوزيع الطبيعي ، يبدو أنها "داخل النطاق".

أرز. 7. رسم بياني لمتغير Pt_Poor.

هذا الحكم شخصي إلى حد ما. القاعدة العامة هي أن القيم المتطرفة يجب أن تؤخذ في الاعتبار إذا كانت الملاحظة (أو الملاحظات) لا تقع ضمن الفاصل الزمني (يعني ± 3 مرات الانحراف المعياري). في هذه الحالة ، يجدر تكرار التحليل مع القيم المتطرفة وبدونها للتأكد من أنه ليس لها تأثير خطير على العلاقة المتبادلة بين أفراد المجتمع.

مبعثر

إذا كانت إحدى الفرضيات مقدمة حول العلاقة بين المتغيرات المحددة ، فمن المفيد التحقق منها في مخطط مخطط التشتت المقابل.

أرز. 8. مبعثر.

يوضح الشكل المبعثر ارتباطًا سلبيًا واضحًا (-65) بين المتغيرين. كما يُظهر فاصل الثقة 95٪ لخط الانحدار ، أي مع احتمال 95٪ يمر خط الانحدار بين المنحنيين المتقطعين.

معايير الأهمية

أرز. 9. جدول يحتوي على معايير الأهمية.

يؤكد اختبار معامل الانحدار Pop_Chng أن Pop_Chng مرتبط بشدة بـ Pt_Poor، p<.001 .

حصيلة

يوضح هذا المثال كيفية تحليل خطة انحدار بسيطة. كما تم تقديم تفسير لمعاملات الانحدار غير الموحدة والموحدة. تمت مناقشة أهمية دراسة توزيع استجابة المتغير التابع ، وتم توضيح تقنية لتحديد اتجاه وقوة العلاقة بين المتنبئ والمتغير التابع.

تحليل الانحدار والارتباط - طرق البحث الإحصائي. هذه هي أكثر الطرق شيوعًا لإظهار اعتماد المعلمة على واحد أو أكثر من المتغيرات المستقلة.

أدناه ، باستخدام أمثلة عملية ملموسة ، سننظر في هذين التحليلين الشائعين للغاية بين الاقتصاديين. سنقدم أيضًا مثالاً على الحصول على النتائج عند دمجها.

تحليل الانحدار في Excel

يظهر تأثير بعض القيم (المستقلة ، المستقلة) على المتغير التابع. على سبيل المثال ، يعتمد عدد السكان النشطين اقتصاديًا على عدد المؤسسات والأجور والمعايير الأخرى. أو: كيف تؤثر الاستثمارات الأجنبية وأسعار الطاقة وما إلى ذلك على مستوى الناتج المحلي الإجمالي.

تسمح لك نتيجة التحليل بتحديد الأولويات. واستناداً إلى العوامل الرئيسية ، للتنبؤ ، والتخطيط لتنمية المجالات ذات الأولوية ، واتخاذ القرارات الإدارية.

يحدث الانحدار:

  • خطي (y = a + bx) ؛
  • مكافئ (y = a + bx + cx 2) ؛
  • أسي (y = a * exp (bx)) ؛
  • القوة (y = a * x ^ b) ؛
  • القطعي (y = b / x + a) ؛
  • اللوغاريتمي (y = b * 1n (x) + a) ؛
  • أسي (ص = أ * ب ^ س).

ضع في اعتبارك مثال بناء نموذج انحدار في Excel وتفسير النتائج. لنأخذ نوعًا من الانحدار الخطي.

مهمة. في 6 مؤسسات ، تم تحليل متوسط ​​الراتب الشهري وعدد الموظفين الذين غادروا. من الضروري تحديد اعتماد عدد الموظفين المتقاعدين على متوسط ​​الراتب.

نموذج الانحدار الخطي له الشكل التالي:

ص \ u003d أ 0 + أ 1 × 1 + ... + أ ك س ك.

حيث a هي معاملات الانحدار ، x هي المتغيرات المؤثرة ، و k هي عدد العوامل.

في مثالنا ، Y هو مؤشر العمال المستقليين. العامل المؤثر هو الأجور (x).

يحتوي Excel على وظائف مضمنة يمكن استخدامها لحساب معلمات نموذج الانحدار الخطي. لكن الوظيفة الإضافية Analysis ToolPak ستؤدي ذلك بشكل أسرع.

قم بتنشيط أداة تحليلية قوية:

بمجرد التفعيل ، ستكون الوظيفة الإضافية متاحة ضمن علامة التبويب البيانات.

الآن سنتعامل مباشرة مع تحليل الانحدار.



بادئ ذي بدء ، نولي اهتمامًا لمربع R والمعاملات.

R-square هو معامل التحديد. في مثالنا ، تبلغ 0.755 أو 75.5٪. وهذا يعني أن المعلمات المحسوبة للنموذج توضح العلاقة بين المتغيرات المدروسة بنسبة 75.5٪. كلما زاد معامل التحديد ، كان النموذج أفضل. جيد - فوق 0.8. ضعيف - أقل من 0.5 (بالكاد يمكن اعتبار هذا التحليل معقولًا). في مثالنا - "ليس سيئا".

يُظهر المعامل 64.1428 ما سيكون Y إذا كانت جميع المتغيرات في النموذج قيد الدراسة تساوي 0. أي أن العوامل الأخرى التي لم يتم وصفها في النموذج تؤثر أيضًا على قيمة المعلمة التي تم تحليلها.

يُظهر المعامل -0.16285 وزن المتغير X على Y. أي أن متوسط ​​الراتب الشهري ضمن هذا النموذج يؤثر على عدد المتسربين بوزن -0.16285 (هذه درجة صغيرة من التأثير). تشير علامة "-" إلى وجود أثر سلبي: فكلما ارتفع الراتب ، قل معدل الإقلاع عن التدخين. وهو عادل.



تحليل الارتباط في Excel

يساعد تحليل الارتباط في تحديد ما إذا كانت هناك علاقة بين المؤشرات في عينة واحدة أو عينتين. على سبيل المثال ، بين وقت تشغيل الماكينة وتكلفة الإصلاح ، وسعر المعدات ومدة التشغيل ، وطول ووزن الأطفال ، إلخ.

إذا كانت هناك علاقة ، فعندئذ ما إذا كانت الزيادة في معلمة واحدة تؤدي إلى زيادة (ارتباط إيجابي) أو انخفاض (سلبي) في الآخر. يساعد تحليل الارتباط المحلل على تحديد ما إذا كانت قيمة أحد المؤشرات يمكن أن تتنبأ بالقيمة المحتملة لمؤشر آخر.

يُشار إلى معامل الارتباط r. يختلف من +1 إلى -1. سيكون تصنيف الارتباطات لمناطق مختلفة مختلفًا. عندما تكون قيمة المعامل 0 ، لا توجد علاقة خطية بين العينات.

ضع في اعتبارك كيفية استخدام Excel للعثور على معامل الارتباط.

تُستخدم الدالة CORREL للعثور على المعاملات المزدوجة.

المهمة: تحديد ما إذا كانت هناك علاقة بين وقت تشغيل المخرطة وتكلفة صيانتها.

ضع المؤشر في أي خلية واضغط على زر fx.

  1. في فئة "إحصائية" ، حدد وظيفة CORREL.
  2. الوسيطة "الصفيف 1" - النطاق الأول للقيم - وقت الجهاز: A2: A14.
  3. الوسيطة "المصفوفة 2" - النطاق الثاني للقيم - تكلفة الإصلاحات: B2: B14. انقر فوق موافق.

لتحديد نوع الاتصال ، تحتاج إلى إلقاء نظرة على العدد المطلق للمعامل (كل مجال من مجالات النشاط له مقياسه الخاص).

لتحليل الارتباط للعديد من المعلمات (أكثر من 2) ، يكون من الأنسب استخدام "تحليل البيانات" (إضافة "حزمة التحليل"). في القائمة ، تحتاج إلى تحديد ارتباط وتعيين مصفوفة. الجميع.

سيتم عرض المعاملات الناتجة في مصفوفة الارتباط. مثل هذه:

تحليل الارتباط والانحدار

في الممارسة العملية ، غالبًا ما يتم استخدام هاتين الطريقتين معًا.

مثال:


الآن أصبحت بيانات تحليل الانحدار مرئية.

1. لأول مرة تم تقديم مصطلح "الانحدار" من قبل مؤسس القياسات الحيوية F. Galton (القرن التاسع عشر) ، الذي طور أفكاره من قبل أتباعه K. Pearson.

تحليل الانحدار- طريقة لمعالجة البيانات الإحصائية تسمح لك بقياس العلاقة بين سبب أو أكثر (علامات العوامل) والنتيجة (الإشارة الفعالة).

إشارة- هذه هي السمة المميزة الرئيسية أو سمة الظاهرة أو العملية قيد الدراسة.

علامة فعالة -مؤشر التحقيق.

علامة العامل- مؤشر يؤثر على قيمة السمة الفعالة.

الغرض من تحليل الانحدار هو تقييم الاعتماد الوظيفي لمتوسط ​​قيمة السمة الفعالة ( في) من عاملي ( x 1 ، x 2 ، ... ، x n) ، معبرًا عنها كـ معادلات الانحدار

في= F(x 1 ، x 2 ، ... ، x n). (6.1)

هناك نوعان من الانحدار: ثنائي ومتعدد.

الانحدار المزدوج (البسيط)- معادلة الشكل:

في= F(x). (6.2)

تعتبر السمة الناتجة في الانحدار الزوجي دالة في وسيطة واحدة ، أي عامل واحد.

يتضمن تحليل الانحدار الخطوات التالية:

تعريف نوع الوظيفة ؛

تحديد معاملات الانحدار.

حساب القيم النظرية للسمة الفعالة ؛

التحقق من الدلالة الإحصائية لمعاملات الانحدار.

التحقق من الدلالة الإحصائية لمعادلة الانحدار.

الانحدار المتعدد- معادلة الشكل:

في= F(x 1 ، x 2 ، ... ، x n). (6.3)

تعتبر الميزة الناتجة كدالة لعدة حجج ، أي عوامل كثيرة.

2. من أجل تحديد نوع الوظيفة بشكل صحيح ، من الضروري إيجاد اتجاه الاتصال بناءً على البيانات النظرية.

وفقًا لاتجاه الاتصال ، ينقسم الانحدار إلى:

· الانحدار المباشرتنشأ بشرط زيادة أو نقصان القيمة المستقلة " X "قيم الكمية التابعة " في"أيضًا تزيد أو تنقص وفقًا لذلك ؛

· الانحدار العكسيتنشأ بشرط زيادة أو نقصان القيمة المستقلة "X"قيمة تعتمد " في"ينخفض ​​أو يزيد وفقًا لذلك.

لتوصيف العلاقات ، يتم استخدام الأنواع التالية من معادلات الانحدار المزدوجة:

· ص = أ + ب سخطي؛

· y = e ax + b - أسي ؛

· y = a + b / x - قطعي ؛

· ص = أ + ب 1 س + ب 2 × 2 - قطع مكافئ ؛

· ص = أب س - أسيوإلخ.

أين أ ، ب 1 ، ب 2- معاملات (بارامترات) المعادلة ؛ في- علامة فعالة X- علامة العامل.

3. يتم تقليل بناء معادلة الانحدار إلى تقدير معاملاتها (المعلمات) ، لذلك يستخدمونها طريقة التربيع الصغرى(MNK).

تتيح لك طريقة المربعات الصغرى الحصول على مثل هذه التقديرات للمعلمات ، حيث يكون مجموع الانحرافات التربيعية للقيم الفعلية للميزة الفعالة " في»من نظري« ص س»الحد الأدنى ، هذا هو

خيارات معادلة الانحدار ص = أ + ب سبواسطة طريقة المربعات الصغرى يتم تقديرها باستخدام الصيغ:

أين أ -معامل مجاني ب- معامل الانحدار ، يوضح مدى تغير العلامة الناتجة ذ»عند تغيير سمة العامل« x»لكل وحدة قياس.

4. لتقييم الدلالة الإحصائية لمعاملات الانحدار ، يتم استخدام اختبار الطالب t.

مخطط للتحقق من أهمية معاملات الانحدار:

1) ح 0: أ=0, ب= 0 - تختلف معاملات الانحدار بشكل طفيف عن الصفر.

ح 1: أ ≠ 0, ب ≠ 0 - تختلف معاملات الانحدار اختلافًا كبيرًا عن الصفر.

2) ص= 0.05 - مستوى الأهمية.

أين م ب,م أ- أخطاء عشوائية:

; . (6.7)

4) ر الجدول(ص ؛ F),

أين F=ن- ك- 1 - عدد درجات الحرية (قيمة الجدول) ، ن- عدد المشاهدات ، ك X ".

5) إذا انحرفت أي. معامل كبير.

إذا تم قبوله ، أي. المعامل غير مهم.

5. للتحقق من صحة معادلة الانحدار المركبة ، يتم استخدام معيار فيشر.

مخطط للتحقق من أهمية معادلة الانحدار:

1) ح 0:معادلة الانحدار ليست كبيرة.

ح 1:معادلة الانحدار معنوية.

2) ص= 0.05 - مستوى الأهمية.

3) , (6.8)

أين هو عدد الملاحظات. ك- عدد المعلمات في المعادلة مع المتغيرات " X "; في- القيمة الفعلية للميزة الفعالة ؛ ص س- القيمة النظرية للسمة الفعالة ؛ - معامل الارتباط الزوجي.

4) الجدول F(ص ؛ و 1 ؛ f2),

أين و 1 \ u003d ك ، و 2 \ u003d n-k-1-عدد درجات الحرية (قيم الجدول).

5) إذا F احسب> جدول F، ثم يتم اختيار معادلة الانحدار بشكل صحيح ويمكن تطبيقها في الممارسة العملية.

اذا كان F احسب ، ثم يتم اختيار معادلة الانحدار بشكل غير صحيح.

6. المؤشر الرئيسي الذي يعكس قياس جودة تحليل الانحدار هو معامل التحديد (R 2).

معامل التحديديوضح نسبة المتغير التابع " في»يؤخذ في الاعتبار في التحليل وينتج عن تأثير العوامل المدرجة في التحليل.

معامل التحديد (R2)يأخذ القيم في النطاق. تكون معادلة الانحدار نوعية إذا R2 ≥0,8.

معامل التحديد يساوي مربع معامل الارتباط ، أي

مثال 6.1.بناءً على البيانات التالية ، قم بتكوين وتحليل معادلة الانحدار:

المحلول.

1) احسب معامل الارتباط:. العلاقة بين العلامات مباشرة و معتدلة.

2) بناء معادلة انحدار خطي مزدوج.

2.1) قم بعمل جدول حسابي.

X في هو × 2 ص س (ص ص س) 2
55,89 47,54 65,70
45,07 15,42 222,83
54,85 34,19 8,11
51,36 5,55 11,27
42,28 45,16 13,84
47,69 1,71 44,77
45,86 9,87 192,05
مجموع 159,45 558,55
متوسط 77519,6 22,78 79,79 2990,6

,

معادلة الانحدار الخطي المقترنة: ص س \ u003d 25.17 + 0.087 س.

3) البحث عن القيم النظرية " ص س»باستبدال القيم الفعلية في معادلة الانحدار« X».

4) رسم الرسوم البيانية الفعلية " في"والقيم النظرية " ص س»الميزة الفعالة (الشكل 6.1): r xy = 0.47) وعدد قليل من الملاحظات.

7) احسب معامل التحديد: R2= (0.47) 2 = 0.22. المعادلة المركبة ذات نوعية رديئة.

لان الحسابات أثناء تحليل الانحدار ضخمة جدًا ، يوصى باستخدام برامج خاصة ("Statistica 10" ، SPSS ، إلخ).

يوضح الشكل 6.2 جدولاً بنتائج تحليل الانحدار الذي تم إجراؤه باستخدام برنامج "Statistica 10".

الشكل 6.2. نتائج تحليل الانحدار باستخدام برنامج "Statistica 10"

5. الأدب:

1. Gmurman V.E. نظرية الاحتمالات والإحصاء الرياضي: Proc. دليل للجامعات / V.E. جمورمان. - م: المدرسة العليا 2003. - 479 ص.

2. Koichubekov B.K. الإحصاء الحيوي: كتاب مدرسي. - ألماتي: إيفيرو ، 2014. - 154 ص.

3. Lobotskaya N.L. الرياضيات العليا. / ن. لوبوتسكايا ، يو في. موروزوف ، أ. دوناييف. - مينسك: المدرسة العليا ، 1987. - 319 ص.

4. Medic V.A. و Tokmachev MS و Fishman B.B. الإحصاء في الطب وعلم الأحياء: دليل. في مجلدين / إد. يو. كوماروف. T. 1. الإحصاء النظري. - م: الطب 2000. - 412 ص.

5. تطبيق أساليب التحليل الإحصائي لدراسة الصحة العامة والرعاية الصحية: كتاب مدرسي / محرر. Kucherenko V.Z. - الطبعة الرابعة ، المنقحة. وإضافية - م: GEOTAR - ميديا ​​، 2011. - 256 ص.