Ekonometrijos kursinis (2)


Įvadas. Regresinio modelio sudarymas. Reikšmingų kintamųjų pasirinkimas. Kokybinių kintamųjų vertimas fiktyviaisiais kintamasiais. Sklaidos diagrama. Modelio parametrai ir jų reikšmingumas, modelio lygtis. Modelio adekvatumas. Vidutinė santykinė absoliutinė modelio paklaida. Išvados. Priedai.


Darbo tikslas – atrenkant 5 reikšmingus aiškinamuosius kintamuosius, kurie turi įtakos namų ūkio vartojimo išlaidoms, sudaryti regresinį modelį ir išanalizuoti sudaryto modelio parametrų reikšmingumą.

Renkantis 5 reikšmingus kintamuosius pirmiausia atsirinksiu reikšmingiausius kiekybinius kintamuosius. Kiekybinio kintamojo reikšmė tai atsakymas, kiek tiriamojo požymio turi populiacijos elementas. Pasirinkti tinkamus kiekybinius kintamuosius pasinaudosiu Excel programoje esančia „Coorelation” funkciją:

Kad išsiaiškinčiau kokybinių kintamųjų reikšmingumą, kokybinius kintamuosius turėjau paversti fiktyviaisiais kintamaisiais.

Pirmajame paveiksliuke pateikta namų ūkio vartojimo išlaidų diagrama, kurioje matomos keturios išsiskiriančios reikšmės (6700, 4301, 5048 ir 5090). Norint sužinoti ar šios reikšmės yra reikšmingos reikia patikrinti, o šias reikšmes reikia pasiversti fiktyviaisiais kintamaisiais.

Iš pateiktų reikšmių matyti, kad nereikšminga šiuo atveju yra 4301 reikšmė, todėl ši reikšmė yra atmetama. Likusios trys 5090, 5048 ir 6700 yra reikšmingos, todėl šias reikšmes pridedu prie reikšmingu kintamųjų.

Kad išsiaiškinčiau parametrų reikšmingumą pasirenku „Backward” metodą. Pagal kurį, analizuojant kintamuosius išmesiu po vieną nereikšmingą, kol liks reikšmingiausi kintamieji.

Pagal šią analizę matyti, kad didžiausią P-value reikšmė yra miestas, kaimas, dėl to šis kintamasis yra pašalinamas ir toliau reikšmės tikrinamos iš naujo. Dar kartą atlikus parametrų analizę, gaunamas toks rezultatas:

Išanalizavus gautus rezultatus matyti, kad didžiausia P-value reikšmė yra „vyras, moteris“, todėl šis kintamasis pašalinamas, ir toliau analizuojama be šios reikšmės.

„Išskirtis 5048“ turi didžiausią P-value reikšmę, todėl ja taip pat naikinu.

Iš naujausios atliktos analizės matyti, kad likę kintamieji: namų ūkio dydis, namų ūkio disponuojamos pajamos ir išskirtis 6700 yra reikšmingos, kadangi visų reikšmės yra mažesnės nei 0,05. Gaunama tokia modelio lygtis:

Modelio adekvatumą parodo determinacijos koeficientas (R Square), kuris šiuo atveju yra lygus 79,34 %. Tai parodo, kad šio modelio parinkti kintamieji 79,34 % paaiškina namų ūkio vartojimo išlaidas. Kita dalis informacijos galėjo likti liekanose arba modelį nebuvo įtraukti reikšmingesni parametrai. Tačiau 79,34 % yra gana geras determinacijos koeficientas.

Su funkcija ABS apskaičiavau VSAP ir pagal gautą rezultatą matome, kad modelio paklaida yra 52,4 %, tai yra gana didelė paklaida. Ši paklaida parodo, kad modelis nėra visiškai tikslus.

Pagal pateiktus duomenis „Coorelation” funkcijos pagalba atsirinkau du reikšmingiausius kintamuosius: namų ūkio dydį ir namų ūkio disponuojamos pajamas. Papildomai pagal reikšmingumą pasirinkau dar keletą kintamųjų: galvos lytis bei miestas, kaimas.

Kad tinkamai pasirinkčiau kokybinius kintamuosius, pasiverčiau juos fiktyviaisiais kintamaisiais ir patikrinus reikšmingumą atrinkau reikšmingiausius.

Sudaręs namų ūkio vartojimo išlaidų sklaidos diagrama pastebėjau, kad yra keturios išskirtis. Visos išskirtys buvo patikrintos, pastebėjau, kad iš visų keturių išskirčių (4301) buvo mažiausiai reikšminga ir dėl to į modeli nebuvo įtraukta.

  • Microsoft Word 46 KB
  • 2017 m.
  • Lietuvių
  • 16 puslapių (2669 žodžiai)
  • Universitetas
  • Vytautas
  • Ekonometrijos kursinis (2)
    10 - 3 balsai (-ų)
Ekonometrijos kursinis (2). (2017 m. Sausio 07 d.). https://www.mokslobaze.lt/ekonometrijos-kursinis-2.html Peržiūrėta 2019 m. Gruodžio 06 d. 15:41
×
Nežinai kaip atlikti užduotį? Klausk!