Kaip paleisti regresiją programoje „Excel“

Turinys:

Kaip paleisti regresiją programoje „Excel“
Kaip paleisti regresiją programoje „Excel“
Anonim

Regresija programoje „Excel“– tai būdas automatizuoti statistinį kelių informacijos rinkinių palyginimo procesą, siekiant pamatyti, kaip nepriklausomų kintamųjų pokyčiai veikia priklausomų kintamųjų pokyčius. Jei kada nors norėjote rasti ryšį tarp dviejų dalykų, regresijos analizė programoje „Excel“yra vienas geriausių būdų tai padaryti.

Šiame straipsnyje pateiktos instrukcijos taikomos „Excel 2019“, „Excel 2016“, „Excel 2013“, „Excel 2010“.

Ką reiškia regresija?

Regresija yra statistinio modeliavimo metodas, kurį analitikai naudoja norėdami nustatyti ryšius tarp kelių kintamųjų.

Regresijos analizė prasideda nuo vieno kintamojo, kurį bandote analizuoti, ir nuo nepriklausomų kintamųjų, kuriuos tikrinate, kad sužinotumėte, ar jie turi įtakos tam vieninteliam kintamajam. Analizėje nagrinėjami nepriklausomų kintamųjų pokyčiai ir bandoma susieti tuos pokyčius su vieno (priklausomo) kintamojo pokyčiais.

Tai gali atrodyti kaip išplėstinė statistika, tačiau „Excel“šią sudėtingą analizę padaro prieinamą visiems.

Tiesinės regresijos atlikimas programoje „Excel“

Paprasčiausia regresinės analizės forma yra tiesinė regresija. Paprasta tiesinė regresija nagrinėja ryšį tik tarp dviejų kintamųjų.

Pavyzdžiui, toliau pateiktoje skaičiuoklėje rodomi duomenys, kuriuose yra kalorijų, kurias žmogus suvalgė kiekvieną dieną, ir jo svoris tą dieną.

Image
Image

Kadangi šioje skaičiuoklėje yra du duomenų stulpeliai, o vienas kintamasis gali turėti įtakos kitam, galite atlikti šių duomenų regresinę analizę naudodami „Excel“.

Analysis ToolPak priedo įgalinimas

Kad galėtumėte naudoti „Excel“regresinės analizės funkciją, „Excel“parinkčių ekrane turite įjungti „Analysis ToolPak“priedą.

  1. Excel programoje pasirinkite Failas ir pasirinkite Options.

    Image
    Image
  2. Kairiajame naršymo meniu pasirinkite Priedai. Tada įsitikinkite, kad Excel Add-ins pasirinktas Tvarkyti.

    Image
    Image
  3. Galiausiai pasirinkite mygtuką Eiti.

    Image
    Image
  4. Iššokančiajame priedų lange. Įgalinkite Analysis ToolPack spustelėdami priešais esantį laukelį, kad pridėtumėte varnelę, ir pasirinkite OK.

    Image
    Image

Dabar, kai įjungtas analizės įrankių paketas, esate pasirengę pradėti regresijos analizę programoje Excel.

Kaip atlikti paprastą tiesinę regresiją programoje Excel

Naudodami svorio ir kalorijų skaičiuoklę kaip pavyzdį, galite atlikti linijinės regresijos analizę programoje Excel taip.

  1. Pasirinkite Data meniu. Tada grupėje Analysis pasirinkite Data Analysis.

    Image
    Image
  2. Duomenų analizės lange pasirinkite Regression ir spustelėkite Gerai.

    Image
    Image
  3. Įvesties Y diapazonas yra langelių diapazonas, kuriame yra priklausomas kintamasis. Šiame pavyzdyje tai yra svoris. Įvesties X diapazonas yra langelių diapazonas, kuriame yra nepriklausomas kintamasis. Šiame pavyzdyje tai yra kalorijų stulpelis.

    Image
    Image
  4. Antraštės langeliams pasirinkite Labels, tada pasirinkite New Worksheet, kad rezultatai būtų išsiųsti į naują darbalapį. Pasirinkite Gerai, kad „Excel“atliktų analizę ir išsiųstų rezultatus į naują lapą.

    Image
    Image
  5. Išnagrinėkite naują darbalapį. Analizės išvestis turi keletą reikšmių, kurias turite suprasti, kad interpretuotumėte rezultatus.

    Image
    Image

    Kiekvienas iš šių skaičių turi šias reikšmes:

    • Keli R: Koreliacijos koeficientas. 1 rodo stiprų ryšį tarp dviejų kintamųjų, o -1 reiškia, kad yra stiprus neigiamas ryšys. 0 reiškia, kad nėra koreliacijos.
    • R Kvadratas: Determinacijos koeficientas, parodantis, kiek taškų tarp dviejų kintamųjų patenka į regresijos tiesę. Statistiškai tai yra kvadratinių nuokrypių nuo vidurkio suma.
    • Pakoreguotas R kvadratas: statistinė reikšmė, vadinama R kvadratu, pakoreguota pagal jūsų pasirinktų nepriklausomų kintamųjų skaičių.
    • Standartinė klaida: kaip tikslūs regresinės analizės rezultatai. Jei ši klaida nedidelė, regresijos rezultatai tikslesni.
    • Stebėjimai: stebėjimų skaičius jūsų regresijos modelyje.

    Likusios vertės regresijos išvestyje suteikia išsamios informacijos apie mažesnius regresijos analizės komponentus.

    • df: statistinė reikšmė, žinoma kaip laisvės laipsniai, susiję su dispersijos š altiniais.
    • SS: kvadratų suma. Likutinės kvadratų sumos ir bendros SS santykis turėtų būti mažesnis, jei dauguma duomenų atitinka regresijos liniją.
    • MS: vidutinis regresijos duomenų kvadratas.
    • F: Nulinės hipotezės F statistika (F testas). Tai suteikia regresijos modelio reikšmę.
    • Svarbumas F: statistinė vertė, žinoma kaip F P reikšmė.

    Jei nesuprantate statistikos ir regresijos modelių skaičiavimo, santraukos apačioje esančios reikšmės neturės daug reikšmės. Tačiau keli R ir R kvadratai yra du svarbiausi.

Kaip matote, šiame pavyzdyje kalorijos yra stipriai susijusios su bendru svoriu.

Kelių tiesinės regresijos analizė programoje „Excel“

Jei norite atlikti tą pačią tiesinę regresiją, bet su keliais nepriklausomais kintamaisiais, pasirinkite visą diapazoną (keli stulpeliai ir eilutės) Įvesties X diapazonui.

Image
Image

Pasirinkdami kelis nepriklausomus kintamuosius, mažiau tikėtina, kad rasite tokią pat stiprią koreliaciją, nes yra tiek daug kintamųjų.

Tačiau regresinė analizė programoje „Excel“gali padėti rasti sąsajų su vienu ar daugiau iš tų kintamųjų, kurių egzistavimo negalite suprasti, tik peržiūrėję duomenis rankiniu būdu.

Rekomenduojamas: