աղյուս
Ռեգրեսիոն վերլուծություն. Ռեգրեսիոն վերլուծություն

Ռեգրեսիոն վերլուծություն. Ռեգրեսիոն վերլուծություն

Ռեգրեսիոն վերլուծությունը ուսումնասիրում է որոշակի քանակի կախվածությունը մեկ այլ մեծությունից կամ մի քանի այլ մեծություններից: Ռեգրեսիոն վերլուծությունը հիմնականում օգտագործվում է միջնաժամկետ կանխատեսումների, ինչպես նաև երկարաժամկետ կանխատեսումների ժամանակ։ Միջնաժամկետ և երկարաժամկետ ժամանակահատվածները հնարավորություն են տալիս փոփոխություններ հաստատել բիզնես միջավայրում և հաշվի առնել այդ փոփոխությունների ազդեցությունը ուսումնասիրվող ցուցանիշի վրա:

Ռեգրեսիոն վերլուծություն իրականացնելու համար անհրաժեշտ է.

ուսումնասիրված ցուցանիշների վերաբերյալ տարեկան տվյալների առկայությունը,

միանգամյա կանխատեսումների առկայությունը, այսինքն. կանխատեսումներ, որոնք չեն բարելավվում նոր տվյալներով։

Ռեգրեսիոն վերլուծությունը սովորաբար իրականացվում է այնպիսի օբյեկտների համար, որոնք ունեն բարդ, բազմագործոն բնույթ, ինչպիսիք են ներդրումների ծավալը, շահույթը, վաճառքի ծավալը և այլն։

ժամը կանխատեսման նորմատիվ մեթոդորոշվում են որպես նպատակ ընդունված երեւույթի հնարավոր վիճակներին հասնելու ուղիներն ու ժամկետները։ Խոսքը կանխորոշված նորմերի, իդեալների, խթանների և նպատակների հիման վրա երևույթի ցանկալի վիճակների ձեռքբերումը կանխատեսելու մասին է։ Նման կանխատեսումը պատասխանում է հարցին՝ ի՞նչ ճանապարհներով կարելի է հասնել ցանկալիին։ Նորմատիվ մեթոդն ավելի հաճախ օգտագործվում է ծրագրային կամ նպատակային կանխատեսումների համար։ Օգտագործվում է և՛ ստանդարտի քանակական արտահայտությունը, և՛ գնահատման գործառույթի հնարավորությունների որոշակի սանդղակը։

Բնակչության տարբեր խմբերի համար մասնագետների կողմից մշակված որոշակի պարենային և ոչ պարենային ապրանքների սպառման ֆիզիոլոգիական և ռացիոնալ նորմեր օգտագործելու դեպքում, հնարավոր է որոշել այդ ապրանքների սպառման մակարդակը: նշված նորմայի ձեռքբերմանը նախորդող տարիները. Նման հաշվարկները կոչվում են ինտերպոլացիա։ Ինտերպոլացիան երևույթի ժամանակային շարքում բացակայող ցուցանիշների հաշվարկման միջոց է՝ հիմնված հաստատված հարաբերությունների վրա։ Հաշվի առնելով ցուցիչի իրական արժեքը և դրա ստանդարտների արժեքը որպես դինամիկ շարքի ծայրահեղ անդամներ, հնարավոր է որոշել այս շարքի արժեքների մեծությունը: Հետեւաբար, ինտերպոլացիան համարվում է նորմատիվ մեթոդ: Նախկինում տրված բանաձևը (4), որն օգտագործվում է էքստրապոլացիայի մեջ, կարող է օգտագործվել ինտերպոլացիայի մեջ, որտեղ y n-ն այլևս չի բնութագրի իրական տվյալները, այլ ցուցիչի ստանդարտը:

Գնահատման ֆունկցիայի հնարավորությունների սանդղակի (դաշտ, սպեկտր), այսինքն՝ նախապատվությունների բաշխման ֆունկցիայի օգտագործման դեպքում նորմատիվ մեթոդում նշվում է մոտավորապես հետևյալ աստիճանավորումը՝ անցանկալի - պակաս ցանկալի - ավելի ցանկալի - ամենացանկալի - օպտիմալ (ստանդարտ):

Կանխատեսման նորմատիվ մեթոդը օգնում է մշակել առաջարկություններ՝ բարձրացնելու օբյեկտիվության մակարդակը, հետևաբար՝ որոշումների արդյունավետությունը:

Մոդելավորում, թերեւս ամենադժվար կանխատեսման մեթոդը։ Մաթեմատիկական մոդելավորում նշանակում է տնտեսական երևույթի նկարագրություն մաթեմատիկական բանաձևերի, հավասարումների և անհավասարությունների միջոցով։ Մաթեմատիկական ապարատը պետք է ճշգրիտ արտացոլի կանխատեսման ֆոնը, թեև բավականին դժվար է ամբողջությամբ արտացոլել կանխատեսվող օբյեկտի ամբողջ խորությունն ու բարդությունը: «Մոդել» տերմինը առաջացել է լատիներեն modelus բառից, որը նշանակում է «չափել»։ Ուստի ավելի ճիշտ կլինի մոդելավորումը դիտարկել ոչ թե որպես կանխատեսման մեթոդ, այլ որպես մոդելի վրա նմանատիպ երեւույթի ուսումնասիրման մեթոդ։

Լայն իմաստով մոդելները կոչվում են ուսումնասիրության առարկայի փոխարինողներ, որոնք այնպիսի նմանության մեջ են նրա հետ, որ թույլ են տալիս նոր գիտելիքներ ստանալ օբյեկտի մասին։ Մոդելը պետք է դիտարկել որպես օբյեկտի մաթեմատիկական նկարագրություն: Այս դեպքում մոդելը սահմանվում է որպես երևույթ (առարկա, տեղադրում), որը որոշակի համապատասխանության մեջ է ուսումնասիրվող օբյեկտի հետ և կարող է փոխարինել այն հետազոտության գործընթացում՝ ներկայացնելով տվյալ օբյեկտի մասին տեղեկատվություն։

Մոդելի ավելի նեղ ընկալմամբ այն համարվում է կանխատեսման օբյեկտ, դրա ուսումնասիրությունը թույլ է տալիս տեղեկատվություն ստանալ ապագայում օբյեկտի հնարավոր վիճակների և այդ վիճակներին հասնելու ուղիների մասին: Այս դեպքում կանխատեսող մոդելի նպատակն է տեղեկատվություն ստանալ ոչ թե օբյեկտի մասին ընդհանրապես, այլ միայն նրա ապագա վիճակների մասին։ Այնուհետև մոդել կառուցելիս անհնար է ուղղակիորեն ստուգել դրա համապատասխանությունը օբյեկտին, քանի որ մոդելը ներկայացնում է միայն իր ապագա վիճակը, իսկ օբյեկտն ինքը ներկայումս կարող է բացակայել կամ այլ գոյություն ունենալ:

Մոդելները կարող են լինել նյութական և իդեալական:

Տնտեսագիտության մեջ օգտագործվում են իդեալական մոդելներ։ Սոցիալ-տնտեսական (տնտեսական) երևույթի քանակական նկարագրության համար ամենակատարյալ իդեալական մոդելը մաթեմատիկական մոդելն է, որն օգտագործում է թվեր, բանաձևեր, հավասարումներ, ալգորիթմներ կամ գրաֆիկական պատկեր: Տնտեսական մոդելների օգնությամբ որոշեք.

տարբեր տնտեսական ցուցանիշների փոխհարաբերությունները.

ցուցանիշների վրա դրված տարբեր տեսակի սահմանափակումներ.

գործընթացի օպտիմալացման չափանիշներ:

Օբյեկտի իմաստալից նկարագրությունը կարող է ներկայացվել նրա պաշտոնականացված սխեմայի տեսքով, որը ցույց է տալիս, թե որ պարամետրերն ու սկզբնական տեղեկատվությունը պետք է հավաքվեն ցանկալի արժեքները հաշվարկելու համար: Մաթեմատիկական մոդելը, ի տարբերություն պաշտոնական սխեմայի, պարունակում է օբյեկտը բնութագրող հատուկ թվային տվյալներ: Մաթեմատիկական մոդելի զարգացումը մեծապես կախված է մոդելավորվող գործընթացի էության մասին կանխատեսողի պատկերացումներից: Հիմնվելով իր պատկերացումների վրա՝ նա առաջ է քաշում աշխատանքային վարկած, որի օգնությամբ ստեղծվում է մոդելի վերլուծական գրառում՝ բանաձևերի, հավասարումների և անհավասարությունների տեսքով։ Հավասարումների համակարգի լուծման արդյունքում ստացվում են ֆունկցիայի կոնկրետ պարամետրեր, որոնք նկարագրում են ժամանակի ընթացքում ցանկալի փոփոխականների փոփոխությունը։

Աշխատանքի կարգը և հաջորդականությունը, որպես կանխատեսման կազմակերպման տարր, որոշվում է կախված կիրառվող կանխատեսման մեթոդից: Սովորաբար այս աշխատանքն իրականացվում է մի քանի փուլով.

1-ին փուլ - կանխատեսող հետադարձ հայացք, այսինքն՝ կանխատեսման օբյեկտի և կանխատեսման նախապատմության հաստատում։ Առաջին փուլում աշխատանքը կատարվում է հետևյալ հաջորդականությամբ.

անցյալում օբյեկտի նկարագրության ձևավորում, որը ներառում է օբյեկտի նախնական կանխատեսման վերլուծություն, դրա պարամետրերի գնահատում, դրանց նշանակությունը և փոխհարաբերությունները,

տեղեկատվության աղբյուրների նույնականացում և գնահատում, դրանց հետ աշխատանքի կարգը և կազմակերպումը, հետադարձ տեղեկատվության հավաքագրումն ու տեղադրումը.

հետազոտության նպատակների սահմանում.

Կատարելով կանխատեսող հետահայաց առաջադրանքները՝ կանխատեսողները ուսումնասիրում են օբյեկտի զարգացման պատմությունը և կանխատեսման նախապատմությունը՝ դրանց համակարգված նկարագրությունը ստանալու համար։

Փուլ 2 - կանխատեսող ախտորոշում, որի ընթացքում ուսումնասիրվում է կանխատեսման օբյեկտի համակարգված նկարագրությունը և կանխատեսման նախապատմությունը՝ դրանց զարգացման միտումները բացահայտելու և կանխատեսման մոդելներն ու մեթոդները ընտրելու համար: Աշխատանքը կատարվում է հետևյալ հաջորդականությամբ.

կանխատեսվող օբյեկտի մոդելի մշակում, ներառյալ օբյեկտի պաշտոնական նկարագրությունը, ստուգելով մոդելի համապատասխանության աստիճանը օբյեկտին.

կանխատեսման մեթոդների ընտրություն (հիմնական և օժանդակ), ալգորիթմի և աշխատանքային ծրագրերի մշակում։

3-րդ փուլ՝ հովանավորչություն, այսինքն՝ կանխատեսման լայնածավալ մշակման գործընթացը, ներառյալ՝ 1) կանխատեսվող պարամետրերի հաշվարկը տվյալ առաջատար ժամանակահատվածի համար. 2) կանխատեսման առանձին բաղադրիչների սինթեզ.

4-րդ փուլ՝ կանխատեսման գնահատում, ներառյալ դրա ստուգումը, այսինքն՝ հավաստիության, ճշգրտության և վավերականության աստիճանի որոշումը:

Հետախուզման և գնահատման ընթացքում կանխատեսման խնդիրները և դրա գնահատումը լուծվում են նախորդ փուլերի հիման վրա:

Նշված փուլավորումը մոտավոր է և կախված է հիմնական կանխատեսման մեթոդից:

Կանխատեսման արդյունքները կազմվում են վկայագրի, հաշվետվության կամ այլ նյութի տեսքով և ներկայացվում հաճախորդին:

Կանխատեսման ժամանակ կարելի է նշել կանխատեսման շեղումը օբյեկտի իրական վիճակից, որը կոչվում է կանխատեսման սխալ, որը հաշվարկվում է բանաձևով.

;
;
. (9.3)

Կանխատեսման սխալների աղբյուրները

Հիմնական աղբյուրները կարող են լինել.

1. Անցյալից տվյալների պարզ փոխանցում (էքստրապոլացիա) ապագա (օրինակ՝ ընկերությունը չունի կանխատեսման այլ տարբերակներ, բացառությամբ վաճառքի 10% աճի)։

2. Իրադարձության հավանականությունը և ուսումնասիրվող օբյեկտի վրա դրա ազդեցությունը ճշգրիտ որոշելու անկարողությունը:

3. Պլանի իրականացման վրա ազդող չնախատեսված դժվարություններ (խաթարող իրադարձություններ), օրինակ՝ վաճառքի բաժնի ղեկավարի հանկարծակի հեռացումը:

Ընդհանուր առմամբ, կանխատեսման ճշգրտությունը մեծանում է կանխատեսման փորձի կուտակման և դրա մեթոդների մշակման հետ:

Ռեգրեսիոն վերլուծություն

հետընթաց (գծային) վերլուծություն- կախյալ փոփոխականի վրա մեկ կամ մի քանի անկախ փոփոխականների ազդեցությունն ուսումնասիրելու վիճակագրական մեթոդ. Անկախ փոփոխականներն այլ կերպ կոչվում են ռեգրեսորներ կամ կանխատեսողներ, իսկ կախյալ փոփոխականները՝ չափանիշներ: Տերմինաբանություն կախյալԵվ անկախփոփոխականներն արտացոլում են միայն փոփոխականների մաթեմատիկական կախվածությունը ( տես Կեղծ հարաբերակցություն), այլ ոչ թե պատճառահետևանքային կապ:

Ռեգրեսիոն վերլուծության նպատակները

Չափանիշի (կախյալ) փոփոխականի փոփոխության դետերմինիզմի աստիճանի որոշումը կանխագուշակներով (անկախ փոփոխականներով)
Կախված փոփոխականի արժեքի կանխատեսում՝ օգտագործելով անկախ փոփոխական(ներ)ը
Անհատական անկախ փոփոխականների ներդրման որոշում կախվածության փոփոխության մեջ

Ռեգրեսիոն վերլուծությունը չի կարող օգտագործվել փոփոխականների միջև կապի առկայության մասին որոշելու համար, քանի որ նման հարաբերությունների առկայությունը նախապայման է վերլուծությունը կիրառելու համար:

Ռեգրեսիայի մաթեմատիկական սահմանում

Խիստ ռեգրեսիվ կախվածությունը կարող է սահմանվել հետևյալ կերպ. Թող , լինեն պատահական փոփոխականներ՝ տվյալ համատեղ հավանականության բաշխմամբ: Եթե արժեքների յուրաքանչյուր հավաքածուի համար սահմանվում է պայմանական ակնկալիք

(ընդհանուր ռեգրեսիայի հավասարում),

ապա ֆունկցիան կանչվում է հետընթաց Y-ը գնահատում է ըստ արժեքների, և դրա գրաֆիկը. ռեգրեսիայի գիծկողմից, կամ ռեգրեսիայի հավասարումը.

Կախվածությունը դրսևորվում է փոփոխության ժամանակ Y-ի միջին արժեքների փոփոխությամբ: Թեև արժեքների յուրաքանչյուր ֆիքսված բազմության համար մեծությունը մնում է պատահական փոփոխական՝ որոշակի դիսպերսիայով:

Հարցը պարզաբանելու համար, թե որքանով է ռեգրեսիոն վերլուծությունը գնահատում Y-ի փոփոխությունը փոփոխությամբ, Y-ի շեղման միջին արժեքը օգտագործվում է տարբեր արժեքների հավաքածուների համար (իրականում մենք խոսում ենք ցրվածության չափման մասին. կախյալ փոփոխական ռեգրեսիայի գծի շուրջ):

Նվազագույն քառակուսիների մեթոդ (գործակիցների հաշվարկ)

Գործնականում ռեգրեսիայի գիծն ամենից հաճախ փնտրվում է ձևով գծային ֆունկցիա(գծային ռեգրեսիա), որը լավագույնս համապատասխանում է ցանկալի կորին: Սա արվում է նվազագույն քառակուսիների մեթոդի կիրառմամբ, երբ իրականում դիտարկված արժեքների քառակուսի շեղումների գումարը նվազագույնի է հասցվում (նշանակում է ուղիղ գծի օգտագործմամբ գնահատումներ, որը ներկայացնում է ցանկալի ռեգրեսիոն կախվածությունը).

(M - նմուշի չափը): Այս մոտեցումը հիմնված է հայտնի փաստոր վերը նշված արտահայտության մեջ հայտնված գումարը նվազագույն արժեքը վերցնում է հենց այն դեպքի համար, երբ .

Նվազագույն քառակուսիների մեթոդով ռեգրեսիոն վերլուծության խնդիրը լուծելու համար ներկայացվում է հայեցակարգը մնացորդային գործառույթներ:

Մնացորդային ֆունկցիայի նվազագույնի պայմանը.

Ստացված համակարգը համակարգն է գծային հավասարումներանհայտի հետ

Եթե մատրիցով ներկայացնենք հավասարումների ձախ կողմի ազատ անդամները

և մատրիցի աջ կողմում գտնվող անհայտների գործակիցները

ապա ստանում ենք մատրիցային հավասարումը. , որը հեշտությամբ լուծվում է Գաուսի մեթոդով։ Ստացված մատրիցը կլինի մի մատրից, որը պարունակում է ռեգրեսիոն գծի հավասարման գործակիցները.

Լավագույն գնահատականները ստանալու համար անհրաժեշտ է կատարել LSM նախադրյալները (Գաուս-Մարկովի պայմանները): Անգլերեն գրականության մեջ նման գնահատականները կոչվում են BLUE (Best Linear Unbiased Estimators)՝ լավագույն գծային անկողմնակալ գնահատականները:

Ռեգրեսիայի պարամետրերի մեկնաբանում

Պարամետրերը մասնակի հարաբերակցության գործակիցներ են. մեկնաբանվում է որպես Y-ի շեղումների հարաբերակցությունը, որը բացատրվում է մնացած գուշակողների ազդեցությունը ֆիքսելով, այսինքն՝ այն չափում է Y-ի բացատրության մեջ անհատական ներդրումը: Փոխկապակցված գուշակողների դեպքում առկա է գնահատումների անորոշության խնդիր: , որոնք կախված են այն հաջորդականությունից, որով գուշակները ներառվում են մոդելում: Նման դեպքերում անհրաժեշտ է կիրառել հարաբերակցության և փուլային ռեգրեսիոն վերլուծության մեթոդները։

Խոսելով ռեգրեսիոն վերլուծության ոչ գծային մոդելների մասին, հարկ է ուշադրություն դարձնել, թե արդյոք մենք խոսում ենք ոչ գծայինության մասին անկախ փոփոխականներում (ֆորմալ տեսանկյունից, հեշտությամբ վերածվում է գծային ռեգրեսիայի), թե՞ ոչ գծայինության մասին՝ գնահատված պարամետրերում։ (առաջացնելով հաշվողական լուրջ դժվարություններ): Ոչ գծայինության առաջին տիպի դեպքում, իմաստալից տեսանկյունից, կարևոր է առանձնացնել ձևի անդամների մոդելում երևույթը , , նշելով հատկանիշների միջև փոխազդեցության առկայությունը և այլն (տես Բազմագծայինություն):

տես նաեւ

Հղումներ

www.kgafk.ru - Դասախոսություն «Ռեգրեսիոն վերլուծություն» թեմայով
www.basegroup.ru - ռեգրեսիոն մոդելներում փոփոխականներ ընտրելու մեթոդներ

գրականություն

Նորման Դրեյփեր, Հարի ՍմիթԿիրառական ռեգրեսիոն վերլուծություն. Բազմակի ռեգրեսիա= Կիրառական ռեգրեսիոն վերլուծություն: - 3-րդ հրատ. - Մ .: «Դիալեկտիկա», 2007. - Ս. 912. - ISBN 0-471-17082-8
Վիճակագրական մոդելների գնահատման կայուն մեթոդներ. Մենագրություն. - K. PP "Sansparelle", 2005. - S. 504. - ISBN 966-96574-0-7, UDC: 519.237.5:515.126.2, LBC 22.172 + 22.152
Ռադչենկո Ստանիսլավ Գրիգորևիչ,Ռեգրեսիոն վերլուծության մեթոդիկա. Մենագրություն. - K. : "Korniychuk", 2011. - S. 376. - ISBN 978-966-7599-72-0

Վիքիմեդիա հիմնադրամ. 2010 թ .

Ի՞նչ է ռեգրեսիան:

Դիտարկենք երկու շարունակական փոփոխականներ x=(x 1, x 2, .., x n), y=(y 1, y 2, ..., y n):

Եկեք կետերը տեղադրենք 2D ցրման գծապատկերի վրա և ասենք, որ ունենք գծային հարաբերությունեթե տվյալները մոտավոր են ուղիղ գծով.

Եթե ենթադրենք, որ yկախված x, և փոփոխությունները yփոփոխություններով պայմանավորված x, մենք կարող ենք սահմանել ռեգրեսիոն գիծ (հետընթաց yվրա x), որը լավագույնս նկարագրում է այս երկու փոփոխականների միջև ուղիղ գծային կապը:

«Ռեգեսիա» բառի վիճակագրական օգտագործումը գալիս է մի երևույթից, որը հայտնի է որպես ռեգրեսիա դեպի միջին, որը վերագրվում է սըր Ֆրենսիս Գալթոնին (1889):

Նա ցույց տվեց, որ թեև բարձրահասակ հայրերը հակված են բարձրահասակ տղաներ ունենալ, որդիների միջին հասակը ավելի փոքր է, քան իրենց բարձրահասակ հայրերը: Որդիների միջին հասակը «հետ է գնացել» և «հետ է շարժվել» մինչև բնակչության բոլոր հայրերի միջին հասակը։ Այսպիսով, միջինում բարձրահասակ հայրերն ունենում են ավելի ցածր (բայց դեռ բարձրահասակ) որդիներ, իսկ ցածրահասակ հայրերը՝ ավելի բարձրահասակ (բայց դեռ բավականին ցածրահասակ) որդիներ։

ռեգրեսիայի գիծ

Մաթեմատիկական հավասարում, որը գնահատում է պարզ (զույգ) գծային ռեգրեսիոն գիծ.

xկոչվում է անկախ փոփոխական կամ կանխատեսող:

Յկախված կամ պատասխան փոփոխականն է: Սա այն արժեքն է, որին մենք ակնկալում ենք y(միջին հաշվով), եթե մենք գիտենք արժեքը x, այսինքն. կանխատեսված արժեքն է y»

ա- գնահատման գծի անվճար անդամ (հատում); այս արժեքը Յ, Երբ x=0(նկ.1):
բ- գնահատված գծի թեքություն կամ գրադիենտ; դա այն գումարն է, որով Յաճում է միջինը, եթե մենք ավելացնենք xմեկ միավորի համար:
աԵվ բկոչվում են գնահատված գծի ռեգրեսիայի գործակիցներ, թեև այս տերմինը հաճախ օգտագործվում է միայն բ.

Զույգ գծային ռեգրեսիան կարող է ընդլայնվել՝ ներառելով մեկից ավելի անկախ փոփոխականներ. այս դեպքում այն հայտնի է որպես բազմակի ռեգրեսիա.

Նկ.1. Գծային ռեգրեսիոն գիծ, որը ցույց է տալիս a-ի և b թեքության հատումը (Y-ի աճի չափը, երբ x-ը մեծանում է մեկ միավորով)

Նվազագույն քառակուսի մեթոդ

Մենք կատարում ենք ռեգրեսիոն վերլուծություն՝ օգտագործելով դիտարկումների նմուշը, որտեղ աԵվ բ- ճշմարիտ (ընդհանուր) պարամետրերի ընտրանքային գնահատականներ, α և β, որոնք որոշում են պոպուլյացիայի (ընդհանուր բնակչության) գծային ռեգրեսիայի գիծը:

Գործակիցների որոշման ամենապարզ մեթոդը աԵվ բէ նվազագույն քառակուսի մեթոդ(MNK):

Համապատասխանությունը գնահատվում է՝ հաշվի առնելով մնացորդները (գծից յուրաքանչյուր կետի ուղղահայաց հեռավորությունը, օրինակ՝ մնացորդային = դիտելի y- կանխատեսել է y, բրինձ. 2).

Լավագույն համապատասխանության գիծն ընտրված է այնպես, որ մնացորդների քառակուսիների գումարը նվազագույն լինի:

Բրինձ. 2. Գծային ռեգրեսիոն գիծ՝ պատկերված մնացորդներով (ուղղահայաց կետավոր գծեր) յուրաքանչյուր կետի համար:

Գծային ռեգրեսիայի ենթադրություններ

Այսպիսով, յուրաքանչյուր դիտարկվող արժեքի համար մնացորդը հավասար է տարբերությանը և համապատասխան կանխատեսվածին, յուրաքանչյուր մնացորդ կարող է լինել դրական կամ բացասական:

Դուք կարող եք օգտագործել մնացորդները՝ գծային ռեգրեսիայի հետևում հետևյալ ենթադրությունները ստուգելու համար.

Մնացորդները սովորաբար բաշխվում են զրոյական միջինով.

Եթե գծայինության, նորմալության և/կամ հաստատուն շեղումների ենթադրությունները կասկածելի են, մենք կարող ենք փոխակերպել կամ և հաշվարկել նոր ռեգրեսիոն գիծ, որի համար այս ենթադրությունները բավարարված են (օրինակ՝ օգտագործել լոգարիթմական փոխակերպում և այլն):

Աննորմալ արժեքներ (օտարներ) և ազդեցության կետեր

«Ազդեցիկ» դիտարկումը, եթե բաց թողնվի, փոխում է մեկ կամ մի քանի մոդելի պարամետրերի գնահատականները (այսինքն թեքություն կամ հատում):

Օտարը (դիտարկում, որը հակասում է տվյալների հավաքածուի արժեքների մեծ մասին) կարող է լինել «ազդեցիկ» դիտարկում և կարող է լավ հայտնաբերվել տեսողականորեն, երբ դիտում է 2D ցրված գծապատկերը կամ մնացորդների սյուժեն:

Ե՛վ արտանետումների, և՛ «ազդեցիկ» դիտարկումների (կետերի) համար օգտագործվում են մոդելներ և՛ դրանց ներառմամբ, և՛ առանց դրանց, ուշադրություն դարձրեք գնահատման փոփոխությանը (ռեգեսիոն գործակիցներ):

Վերլուծություն կատարելիս ինքնաբերաբար մի հրաժարվեք արտաքուստ կամ ազդեցության կետերից, քանի որ դրանք պարզապես անտեսելը կարող է ազդել արդյունքների վրա: Միշտ ուսումնասիրեք այս արտանետումների պատճառները և վերլուծեք դրանք:

Գծային ռեգրեսիայի վարկած

Գծային ռեգրեսիա կառուցելիս ստուգվում է զրոյական վարկածը, որ β ռեգրեսիոն գծի ընդհանուր թեքությունը հավասար է զրոյի։

Եթե գծի թեքությունը զրո է, ապա և-ի միջև գծային հարաբերություն չկա՝ փոփոխությունը չի ազդում

Զրոյական վարկածը ստուգելու համար, որ իրական թեքությունը զրոյական է, կարող եք օգտագործել հետևյալ ալգորիթմը.

Հաշվարկեք թեստի վիճակագրությունը հավասար հարաբերակցությանը, որը ենթարկվում է ազատության աստիճաններով բաշխմանը, որտեղ գործակցի ստանդարտ սխալը

- մնացորդների շեղումների գնահատում.

Սովորաբար, եթե նշանակալիության մակարդակը հասել է, ապա զրոյական վարկածը մերժվում է:

որտեղ է ազատության աստիճաններով բաշխման տոկոսային կետը, որը տալիս է երկկողմանի թեստի հավանականությունը

Սա այն ընդմիջումն է, որը պարունակում է ընդհանուր թեքություն 95% հավանականությամբ:

Մեծ նմուշների համար, ենթադրենք, մենք կարող ենք մոտավորել 1,96 արժեքով (այսինքն, թեստի վիճակագրությունը հակված կլինի նորմալ բաշխվելու)

Գծային ռեգրեսիայի որակի գնահատում՝ որոշման գործակից R 2

Գծային հարաբերությունների պատճառով և մենք ակնկալում ենք, որ փոփոխությունները փոփոխվում են , և մենք սա անվանում ենք փոփոխություն, որը պայմանավորված է կամ բացատրվում է ռեգրեսիայով: Մնացորդային տատանումները պետք է հնարավորինս փոքր լինեն:

Եթե այո, ապա տատանումների մեծ մասը կբացատրվի ռեգրեսիայով, և կետերը մոտ կլինեն ռեգրեսիոն գծին, այսինքն. տողը լավ է համապատասխանում տվյալներին:

Ընդհանուր շեղումների համամասնությունը, որը բացատրվում է ռեգրեսիայով, կոչվում է որոշման գործակիցը, սովորաբար արտահայտվում է որպես տոկոս և նշվում R2(զույգված գծային ռեգրեսիայում սա արժեք է r2, հարաբերակցության գործակիցի քառակուսին), թույլ է տալիս սուբյեկտիվորեն գնահատել ռեգրեսիայի հավասարման որակը։

Տարբերությունը շեղման տոկոսն է, որը չի կարող բացատրվել ռեգրեսիայով:

Չունենալով գնահատելու պաշտոնական թեստ, մենք ստիպված ենք հիմնվել սուբյեկտիվ դատողության վրա՝ որոշելու ռեգրեսիայի գծի համապատասխանության որակը:

Կանխատեսման համար ռեգրեսիայի գիծ կիրառելը

Դուք կարող եք օգտագործել ռեգրեսիոն գիծ՝ դիտարկվող տիրույթում գտնվող արժեքից արժեք կանխատեսելու համար (երբեք մի արտահանեք այս սահմաններից այն կողմ):

Մենք կանխատեսում ենք որոշակի արժեք ունեցող դիտելիների միջինը՝ փոխարինելով այդ արժեքը ռեգրեսիոն գծի հավասարման մեջ:

Այսպիսով, եթե կանխատեսում ենք, քանի որ մենք օգտագործում ենք այս կանխատեսված արժեքը և դրա ստանդարտ սխալը իրական պոպուլյացիայի միջին վստահության միջակայքը գնահատելու համար:

Այս ընթացակարգի կրկնումը տարբեր արժեքների համար թույլ է տալիս ստեղծել վստահության սահմաններ այս գծի համար: Սա գոտի կամ տարածք է, որը պարունակում է իրական գիծ, օրինակ, 95% վստահության մակարդակով:

Պարզ ռեգրեսիայի պլաններ

Պարզ ռեգրեսիոն նմուշները պարունակում են մեկ շարունակական կանխատեսող: Եթե կան 3 դեպքեր P կանխագուշակող արժեքներով, ինչպիսիք են 7, 4 և 9, և դիզայնը ներառում է առաջին կարգի էֆեկտ P, ապա դիզայնի մատրիցը կլինի X.

և X1-ի համար P-ի օգտագործմամբ ռեգրեսիայի հավասարումը նման է

Y = b0 + b1 P

Եթե պարզ ռեգրեսիոն դիզայնը պարունակում է ավելի բարձր կարգի էֆեկտ P-ի վրա, ինչպիսին է քառակուսի էֆեկտը, ապա դիզայնի մատրիցայի X1 սյունակի արժեքները կբարձրացվեն մինչև երկրորդ ուժը.

և հավասարումը կունենա ձև

Y = b0 + b1 P2

Սիգմա-սահմանափակված և գերպարամետրացված կոդավորման մեթոդները չեն կիրառվում պարզ ռեգրեսիոն նախագծման և միայն շարունակական կանխատեսողներ պարունակող այլ նմուշների նկատմամբ (քանի որ պարզապես չկան կատեգորիկ գուշակողներ): Անկախ ընտրված կոդավորման մեթոդից, շարունակական փոփոխականների արժեքներն ավելանում են համապատասխան հզորությամբ և օգտագործվում են որպես X փոփոխականների արժեքներ: Այս դեպքում փոխակերպում չի կատարվում: Բացի այդ, ռեգրեսիոն պլանները նկարագրելիս կարող եք բաց թողնել X պլանի մատրիցայի դիտարկումը և աշխատել միայն ռեգրեսիոն հավասարման հետ:

Օրինակ՝ Պարզ ռեգրեսիոն վերլուծություն

Այս օրինակը օգտագործում է աղյուսակում ներկայացված տվյալները.

Բրինձ. 3. Սկզբնական տվյալների աղյուսակ.

Տվյալները հիմնված են պատահականության սկզբունքով ընտրված 30 շրջաններում 1960 և 1970 թվականների մարդահամարի համեմատության վրա: Շրջանների անունները ներկայացված են որպես դիտորդական անուններ: Յուրաքանչյուր փոփոխականի վերաբերյալ տեղեկատվությունը ներկայացված է ստորև.

Բրինձ. 4. Փոփոխական բնութագրերի աղյուսակ:

Հետազոտության նպատակը

Այս օրինակի համար կվերլուծվի աղքատության մակարդակի և աղքատության գծից ցածր գտնվող ընտանիքների տոկոսը կանխատեսող ուժի հարաբերակցությունը: Հետևաբար, մենք կվերաբերվենք 3 փոփոխականին (Pt_Poor ) որպես կախյալ փոփոխականի:

Կարելի է վարկած առաջ քաշել՝ ազգաբնակչության փոփոխությունը և աղքատության շեմից ցածր ընտանիքների տոկոսը կապված են։ Թվում է, թե ողջամիտ է ակնկալել, որ աղքատությունը հանգեցնում է բնակչության արտահոսքի, հետևաբար, բացասական հարաբերակցություն կլինի աղքատության շեմից ցածր գտնվող մարդկանց տոկոսի և բնակչության փոփոխության միջև: Հետևաբար, մենք կվերաբերվենք 1 փոփոխականին (Pop_Chng ) որպես կանխատեսող փոփոխականի:

Դիտել արդյունքները

Ռեգրեսիայի գործակիցներ

Բրինձ. 5. Ռեգրեսիայի գործակիցները Pt_Poor Pop_Chng-ի վրա:

Pop_Chng շարքի և Param-ի խաչմերուկում: Pop_Chng-ում Pt_Poor-ի ռեգրեսիայի համար ոչ ստանդարտացված գործակիցը -0,40374 է: Սա նշանակում է, որ բնակչության յուրաքանչյուր միավոր նվազման դեպքում կա աղքատության մակարդակի աճ .40374: Այս ոչ ստանդարտացված գործակցի վերին և ստորին (կանխադրված) 95% վստահության սահմանները չեն ներառում զրո, ուստի ռեգրեսիայի գործակիցը նշանակալի է p մակարդակում:<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

Փոփոխականների բաշխում

Հարաբերակցության գործակիցները կարող են զգալիորեն գերագնահատվել կամ թերագնահատվել, եթե տվյալների մեջ կան մեծ արտանետումներ: Եկեք քննենք Pt_Poor կախված փոփոխականի բաշխումն ըստ շրջանների: Դա անելու համար մենք կկառուցենք Pt_Poor փոփոխականի հիստոգրամը:

Բրինձ. 6. Pt_Poor փոփոխականի հիստոգրամ։

Ինչպես տեսնում եք, այս փոփոխականի բաշխումը զգալիորեն տարբերվում է նորմալ բաշխումից: Այնուամենայնիվ, թեև նույնիսկ երկու շրջաններ (աջ երկու սյունակներում) ունեն աղքատության գծից ցածր գտնվող ընտանիքների ավելի բարձր տոկոս, քան սպասվում էր նորմալ բաշխման դեպքում, նրանք կարծես թե գտնվում են «միջակայքի ներսում»:

Բրինձ. 7. Pt_Poor փոփոխականի հիստոգրամ:

Այս դատողությունը որոշ չափով սուբյեկտիվ է։ Հիմնական կանոնն այն է, որ արտաքուստները պետք է հաշվի առնվեն, եթե դիտարկումը (կամ դիտարկումը) չի ընկնում միջակայքում (միջին ± 3 անգամ ստանդարտ շեղում): Տվյալ դեպքում արժե կրկնել վերլուծությունը՝ ելքերով և առանց դրանց՝ համոզվելու համար, որ դրանք լուրջ ազդեցություն չունեն բնակչության անդամների միջև փոխկապակցվածության վրա:

Scatterplot

Եթե վարկածներից մեկն ապրիորի է տվյալ փոփոխականների փոխհարաբերությունների մասին, ապա օգտակար է այն ստուգել համապատասխան ցրման սյուժեի վրա։

Բրինձ. 8. Ցրված սյուժե:

Scatterplot-ը ցույց է տալիս հստակ բացասական հարաբերակցություն (-.65) երկու փոփոխականների միջև: Այն նաև ցույց է տալիս ռեգրեսիոն գծի 95% վստահության միջակայքը, այսինքն՝ 95% հավանականությամբ ռեգրեսիոն գիծն անցնում է երկու գծված կորերի միջև:

Նշանակության չափանիշներ

Բրինձ. 9. Նշանակության չափանիշները պարունակող աղյուսակ.

Pop_Chng ռեգրեսիայի գործակցի թեստը հաստատում է, որ Pop_Chng-ը խիստ կապված է Pt_Poor, p.<.001 .

Արդյունք

Այս օրինակը ցույց տվեց, թե ինչպես վերլուծել պարզ ռեգրեսիոն պլանը: Ներկայացվել է նաև ոչ ստանդարտացված և ստանդարտացված ռեգրեսիոն գործակիցների մեկնաբանություն: Քննարկվում է կախված փոփոխականի պատասխանի բաշխման ուսումնասիրության կարևորությունը, և ցուցադրվում է կանխատեսողի և կախյալ փոփոխականի միջև փոխհարաբերությունների ուղղությունն ու ուժը որոշելու տեխնիկա:

Ռեգրեսիոն և հարաբերակցության վերլուծություն - վիճակագրական հետազոտության մեթոդներ: Սրանք ամենատարածված եղանակներն են՝ ցույց տալու պարամետրի կախվածությունը մեկ կամ մի քանի անկախ փոփոխականներից:

Ստորև, օգտագործելով կոնկրետ գործնական օրինակներ, կդիտարկենք տնտեսագետների շրջանում այս երկու շատ տարածված վերլուծությունները։ Կբերենք նաև արդյունքների ստացման օրինակ, երբ դրանք համակցված են։

Ռեգրեսիայի վերլուծություն Excel-ում

Ցույց է տալիս որոշ արժեքների (անկախ, անկախ) ազդեցությունը կախված փոփոխականի վրա: Օրինակ, թե ինչպես է տնտեսապես ակտիվ բնակչության թիվը կախված ձեռնարկությունների թվից, աշխատավարձից և այլ պարամետրերից: Կամ՝ ինչպե՞ս են ՀՆԱ-ի մակարդակի վրա ազդում օտարերկրյա ներդրումները, էներգակիրների գները և այլն։

Վերլուծության արդյունքը թույլ է տալիս առաջնահերթություն տալ: Եվ հիմնվելով հիմնական գործոնների վրա՝ կանխատեսել, պլանավորել առաջնահերթ ոլորտների զարգացումը, կայացնել կառավարման որոշումներ։

Հետընթացը տեղի է ունենում.

գծային (y = a + bx);
պարաբոլիկ (y = a + bx + cx 2);
էքսպոնենցիալ (y = a * exp (bx));
հզորություն (y = a*x^b);
հիպերբոլիկ (y = b/x + a);
լոգարիթմական (y = b * 1n (x) + a);
էքսպոնենցիալ (y = a * b^x):

Դիտարկենք Excel-ում ռեգրեսիոն մոդել կառուցելու և արդյունքների մեկնաբանման օրինակը: Վերցնենք ռեգրեսիայի գծային տեսակ։

Առաջադրանք. 6 ձեռնարկություններում վերլուծվել են միջին ամսական աշխատավարձը և հեռացած աշխատողների թիվը։ Անհրաժեշտ է որոշել թոշակի անցած աշխատողների թվի կախվածությունը միջին աշխատավարձից։

Գծային ռեգրեսիայի մոդելն ունի հետևյալ ձևը.

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Այնտեղ, որտեղ a-ն ռեգրեսիայի գործակիցներն են, x-ը՝ ազդող փոփոխականները, իսկ k-ը՝ գործոնների քանակը:

Մեր օրինակում Y-ը աշխատողներից դուրս գալու ցուցանիշն է: Ազդող գործոնը աշխատավարձն է (x):

Excel-ն ունի ներկառուցված գործառույթներ, որոնք կարող են օգտագործվել գծային ռեգրեսիայի մոդելի պարամետրերը հաշվարկելու համար: Բայց Analysis ToolPak հավելումը դա կանի ավելի արագ:

Ակտիվացրեք հզոր վերլուծական գործիք.

Ակտիվացնելուց հետո հավելումը հասանելի կլինի Տվյալների ներդիրում:

Այժմ մենք ուղղակիորեն կզբաղվենք ռեգրեսիոն վերլուծությամբ:

Առաջին հերթին ուշադրություն ենք դարձնում R-քառակուսին և գործակիցներին։

R-քառակուսին որոշման գործակիցն է: Մեր օրինակում այն կազմում է 0,755 կամ 75,5%: Սա նշանակում է, որ մոդելի հաշվարկված պարամետրերը 75,5%-ով բացատրում են ուսումնասիրված պարամետրերի կապը։ Որքան բարձր է որոշման գործակիցը, այնքան լավ է մոդելը: Լավ - 0.8-ից բարձր: Վատ - 0,5-ից պակաս (նման վերլուծությունը հազիվ թե ողջամիտ համարվի): Մեր օրինակում՝ «վատ չէ»։

64.1428 գործակիցը ցույց է տալիս, թե ինչ կլինի Y-ը, եթե դիտարկվող մոդելի բոլոր փոփոխականները հավասար են 0-ի: Այսինքն, այլ գործոններ, որոնք նկարագրված չեն մոդելում, նույնպես ազդում են վերլուծված պարամետրի արժեքի վրա:

-0,16285 գործակիցը ցույց է տալիս X փոփոխականի կշիռը Y-ի վրա: Այսինքն, այս մոդելի միջին ամսական աշխատավարձը ազդում է -0,16285 քաշով հրաժարվողների թվի վրա (սա ազդեցության փոքր աստիճան է): «-» նշանը ցույց է տալիս բացասական ազդեցություն. որքան բարձր է աշխատավարձը, այնքան քիչ է հրաժարվում: Ինչն արդարացի է։

Հարաբերակցության վերլուծություն Excel-ում

Հարաբերակցության վերլուծությունը օգնում է պարզել, թե արդյոք մեկ կամ երկու նմուշների ցուցանիշների միջև կապ կա: Օրինակ, մեքենայի շահագործման ժամանակի և վերանորոգման արժեքի, սարքավորումների գնի և շահագործման տևողության, երեխաների հասակի և քաշի միջև և այլն:

Եթե կա հարաբերություն, ապա մի պարամետրի աճը հանգեցնում է մյուսի աճի (դրական հարաբերակցության), թե նվազմանը (բացասական): Հարաբերակցության վերլուծությունը օգնում է վերլուծաբանին որոշել, թե արդյոք մի ցուցանիշի արժեքը կարող է կանխատեսել մյուսի հնարավոր արժեքը:

Հարաբերակցության գործակիցը նշվում է r. Տատանվում է +1-ից մինչև -1: Տարբեր ոլորտների համար հարաբերակցությունների դասակարգումը տարբեր կլինի: Երբ գործակցի արժեքը 0 է, նմուշների միջև գծային հարաբերություն չկա:

Մտածեք, թե ինչպես օգտագործել Excel-ը հարաբերակցության գործակիցը գտնելու համար:

CORREL ֆունկցիան օգտագործվում է զուգակցված գործակիցները գտնելու համար։

Առաջադրանք. Որոշեք, թե արդյոք կապ կա խառատահաստոցի շահագործման ժամանակի և դրա պահպանման ծախսերի միջև:

Տեղադրեք կուրսորը ցանկացած բջիջի մեջ և սեղմեք fx կոճակը:

«Վիճակագրական» կատեգորիայում ընտրեք CORREL ֆունկցիան:
Փաստարկ «Array 1» - արժեքների առաջին միջակայքը - մեքենայի ժամանակը. A2: A14:
Փաստարկ «Array 2» - արժեքների երկրորդ միջակայք - վերանորոգման արժեքը. B2:B14: Սեղմեք OK:

Կապի տեսակը որոշելու համար անհրաժեշտ է դիտարկել գործակցի բացարձակ թիվը (գործունեության յուրաքանչյուր ոլորտ ունի իր սանդղակը):

Մի քանի պարամետրերի (ավելի քան 2) հարաբերական վերլուծության համար ավելի հարմար է օգտագործել «Տվյալների վերլուծություն» («Վերլուծական փաթեթ» հավելում): Ցանկում դուք պետք է ընտրեք հարաբերակցություն և նշանակեք զանգված: Բոլորը.

Ստացված գործակիցները կցուցադրվեն հարաբերակցության մատրիցով: Այս մեկի պես.

Հարաբերակցային-ռեգեսիոն վերլուծություն

Գործնականում այս երկու տեխնիկան հաճախ օգտագործվում են միասին:

Օրինակ:

Այժմ ռեգրեսիոն վերլուծության տվյալները տեսանելի են։

1. Առաջին անգամ «ռեգեսիա» տերմինը ներմուծել է կենսաչափության հիմնադիր Ֆ. Գալթոնը (XIX դար), որի գաղափարները մշակել է նրա հետևորդ Կ. Փիրսոնը։

Ռեգրեսիոն վերլուծություն- վիճակագրական տվյալների մշակման մեթոդ, որը թույլ է տալիս չափել կապը մեկ կամ մի քանի պատճառների (գործոնային նշաններ) և հետևանքների (արդյունավետ նշանի) միջև:

նշան- սա է ուսումնասիրվող երեւույթի կամ գործընթացի հիմնական տարբերակիչ հատկանիշը, առանձնահատկությունը:

Արդյունավետ նշան -հետազոտված ցուցիչ.

Գործոնի նշան- ցուցանիշ, որն ազդում է արդյունավետ հատկանիշի արժեքի վրա:

Ռեգրեսիոն վերլուծության նպատակն է գնահատել արդյունավետ հատկանիշի միջին արժեքի ֆունկցիոնալ կախվածությունը ( ժամը) գործոնայինից ( x 1, x 2, ..., x n), արտահայտված է որպես ռեգրեսիայի հավասարումներ

ժամը= զ(x 1, x 2, ..., x n). (6.1)

Գոյություն ունի ռեգրեսիայի երկու տեսակ՝ զուգակցված և բազմակի:

Զուգակցված (պարզ) ռեգրեսիա- ձևի հավասարումը.

ժամը= զ(x). (6.2)

Զույգ ռեգրեսիայի արդյունքում ստացված հատկանիշը դիտարկվում է որպես մեկ արգումենտի ֆունկցիա, այսինքն. մեկ գործոն.

Ռեգրեսիայի վերլուծությունը ներառում է հետևյալ քայլերը.

ֆունկցիայի տեսակի սահմանում;

ռեգրեսիայի գործակիցների որոշում;

Արդյունավետ հատկանիշի տեսական արժեքների հաշվարկ.

ռեգրեսիոն գործակիցների վիճակագրական նշանակության ստուգում;

Ռեգրեսիայի հավասարման վիճակագրական նշանակության ստուգում.

Բազմակի ռեգրեսիա- ձևի հավասարումը.

ժամը= զ(x 1, x 2, ..., x n). (6.3)

Արդյունքում ստացված հատկանիշը դիտվում է որպես մի քանի փաստարկների ֆունկցիա, այսինքն. բազմաթիվ գործոններ.

2. Ֆունկցիայի տեսակը ճիշտ որոշելու համար անհրաժեշտ է տեսական տվյալների հիման վրա գտնել կապի ուղղությունը։

Ըստ կապի ուղղության՝ ռեգրեսիան բաժանվում է.

· ուղղակի ռեգրեսիա,առաջացող պայմանով, որ անկախ արժեքի աճով կամ նվազմամբ» X"կախված քանակի արժեքները» ժամը"նաև համապատասխանաբար ավելացնել կամ նվազեցնել;

· հակադարձ ռեգրեսիա,առաջացող պայմանով, որ անկախ արժեքի աճով կամ նվազմամբ «X»կախված արժեք» ժամը"համապատասխանաբար նվազում կամ ավելանում է:

Հարաբերությունները բնութագրելու համար օգտագործվում են զուգակցված ռեգրեսիոն հավասարումների հետևյալ տեսակները.

· y=a+bx– գծային;

· y=e ax + b – էքսպոնենցիալ;

· y=a+b/x – հիպերբոլիկ;

· y=a+b 1 x+b 2 x 2 – պարաբոլիկ;

· y=ab x – էքսպոնենցիալև այլն։

Որտեղ ա, բ 1, բ 2- հավասարման գործակիցները (պարամետրերը); ժամը- արդյունավետ նշան; X- գործոնի նշան.

3. Ռեգրեսիոն հավասարման կառուցումը կրճատվում է նրա գործակիցների (պարամետրերի) գնահատմամբ, դրա համար օգտագործում են. նվազագույն քառակուսի մեթոդ(MNK):

Նվազագույն քառակուսիների մեթոդը թույլ է տալիս ստանալ այնպիսի պարամետրերի գնահատումներ, որոնցում արդյունավետ հատկանիշի իրական արժեքների քառակուսի շեղումների գումարը: ժամը«տեսականից» y x» նվազագույն է, այսինքն

Ռեգրեսիայի հավասարման ընտրանքներ y=a+bxնվազագույն քառակուսիների մեթոդով գնահատվում են բանաձևերով.

Որտեղ Ա -ազատ գործակից, բ- ռեգրեսիայի գործակիցը, ցույց է տալիս, թե որքանով կփոխվի արդյունքի նշանը y«գործոնի հատկանիշը փոխելիս» x» չափման միավորի համար:

4. Ռեգրեսիոն գործակիցների վիճակագրական նշանակությունը գնահատելու համար օգտագործվում է Student-ի t-թեստը։

Ռեգրեսիայի գործակիցների նշանակությունը ստուգելու սխեմա.

1) H 0: ա=0, բ=0 - ռեգրեսիայի գործակիցները աննշանորեն տարբերվում են զրոյից:

H 1: a≠ 0, b≠ 0 - ռեգրեսիայի գործակիցները զգալիորեն տարբերվում են զրոյից:

2) Ռ=0.05 – նշանակության մակարդակ:

Որտեղ մ բ,մ ա- Պատահական սխալներ.

; . (6.7)

4) t սեղան(R; զ),

Որտեղ զ=n-k- 1 - ազատության աստիճանների քանակը (աղյուսակի արժեքը), n- դիտարկումների քանակը, կ X».

5) Եթե , ապա շեղվում է, այսինքն. նշանակալի գործակից:

Եթե , ապա ընդունված է, այսինքն. գործակիցը աննշան է.

5. Կառուցված ռեգրեսիոն հավասարման ճիշտությունը ստուգելու համար օգտագործվում է Ֆիշերի չափանիշը։

Ռեգրեսիայի հավասարման նշանակությունը ստուգելու սխեմա.

1) H 0:ռեգրեսիայի հավասարումը էական չէ։

H 1:ռեգրեսիայի հավասարումը նշանակալի է.

2) Ռ=0.05 – նշանակության մակարդակ:

3) , (6.8)

որտեղ է դիտարկումների քանակը; կ- պարամետրերի քանակը փոփոխականներով հավասարման մեջ » X"; ժամը- արդյունավետ հատկանիշի փաստացի արժեքը. y x- արդյունավետ հատկանիշի տեսական արժեքը. - զույգերի հարաբերակցության գործակիցը.

4) F սեղան(R; f 1 ; f2),

Որտեղ f 1 \u003d k, f 2 \u003d n-k-1-ազատության աստիճանների քանակը (աղյուսակի արժեքները):

5) Եթե F calc >F աղյուսակ, ապա ռեգրեսիայի հավասարումը ճիշտ է ընտրված և կարող է կիրառվել գործնականում։

Եթե F կալկ , ապա ռեգրեսիայի հավասարումը սխալ է ընտրված։

6. Ռեգրեսիոն վերլուծության որակի չափանիշն արտացոլող հիմնական ցուցանիշն է որոշման գործակից (R 2):

Որոշման գործակիցցույց է տալիս կախյալ փոփոխականի որ մասնաբաժինը» ժամը» հաշվի է առնվում վերլուծության ժամանակ և պայմանավորված է վերլուծության մեջ ներառված գործոնների ազդեցությամբ:

Որոշման գործակից (R2)ընդունում է արժեքներ միջակայքում: Ռեգրեսիայի հավասարումը որակական է, եթե R2 ≥0,8.

Որոշման գործակիցը հավասար է հարաբերակցության գործակցի քառակուսուն, այսինքն.

Օրինակ 6.1.Հետևյալ տվյալների հիման վրա կառուցեք և վերլուծեք ռեգրեսիոն հավասարումը.

Լուծում.

1) Հաշվե՛ք հարաբերակցության գործակիցը՝ . Նշանների միջև փոխհարաբերությունները ուղիղ և չափավոր են:

2) Կառուցեք զուգավորված գծային ռեգրեսիայի հավասարում:

2.1) Կազմել հաշվարկային աղյուսակ.

№ X ժամը Հու x 2 y x (y-y x) 2
55,89 47,54 65,70
45,07 15,42 222,83
54,85 34,19 8,11
51,36 5,55 11,27
42,28 45,16 13,84
47,69 1,71 44,77
45,86 9,87 192,05
Գումար 159,45 558,55
Միջին 77519,6 22,78 79,79 2990,6

,

Զուգակցված գծային ռեգրեսիայի հավասարում. y x \u003d 25,17 + 0,087x:

3) Գտեք տեսական արժեքներ» y x«Փաստացի արժեքները փոխարինելով ռեգրեսիայի հավասարման մեջ» X».

4) փաստացի գծապատկերներ ժամը"և տեսական արժեքներ» y x» արդյունավետ հատկանիշ (Նկար 6.1). r xy =0.47) և փոքր թվով դիտարկումներ:

7) Հաշվել որոշման գործակիցը. R2=(0.47) 2 =0.22. Կառուցված հավասարումն անորակ է։

Որովհետեւ Ռեգրեսիոն վերլուծության ժամանակ հաշվարկները բավականին ծավալուն են, խորհուրդ է տրվում օգտագործել հատուկ ծրագրեր («Statistica 10», SPSS և այլն):

Նկար 6.2-ում ներկայացված է «Statistica 10» ծրագրի միջոցով իրականացված ռեգրեսիոն վերլուծության արդյունքներով աղյուսակ:

Նկար 6.2. «Statistica 10» ծրագրի միջոցով իրականացված ռեգրեսիոն վերլուծության արդյունքները.

5. Գրականություն:

1. Գմուրման Վ.Է. Հավանականությունների տեսություն և մաթեմատիկական վիճակագրություն. Պրոց. ձեռնարկ համալսարանների համար / V.E. Գմուրման. - Մ.: Բարձրագույն դպրոց, 2003. - 479 էջ.

2. Կոիչուբեկով Բ.Կ. Կենսագրություն. Դասագիրք. - Ալմաթի: Էվերո, 2014. - 154 էջ.

3. Լոբոցկայա Ն.Լ. Բարձրագույն մաթեմատիկա. / Ն.Լ. Լոբոցկայա, Յու.Վ. Մորոզովը, Ա.Ա. Դունաեւը։ - Մինսկ: Բարձրագույն դպրոց, 1987. - 319 p.

4. Բժիշկ V.A., Tokmachev M.S., Fishman B.B. Վիճակագրություն բժշկության և կենսաբանության մեջ. ուղեցույց. 2 հատորով / Ed. Յու.Մ. Կոմարով. T. 1. Տեսական վիճակագրություն. - Մ.: Բժշկություն, 2000. - 412 էջ.

5. Վիճակագրական վերլուծության մեթոդների կիրառում հանրային առողջության և առողջապահության ուսումնասիրության համար. դասագիրք / խմբ. Կուչերենկո Վ.Զ. - 4-րդ հրատ., վերանայված։ և լրացուցիչ - M.: GEOTAR - Media, 2011. - 256 p.

№	X	ժամը	Հու	x 2	y x		(y-y x) 2
					55,89	47,54	65,70
					45,07	15,42	222,83
					54,85	34,19	8,11
					51,36	5,55	11,27
					42,28	45,16	13,84
					47,69	1,71	44,77
					45,86	9,87	192,05
Գումար						159,45	558,55
Միջին				77519,6		22,78	79,79	2990,6