Daugialypės tiesinės regresijos analizė kursinis darbas (2)


Įvadas. Teorinė dalis. Bendrasis tiesinės regresijos modelis. Daugialypės tiesinės regresijos modelis matricine forma. Modelio prielaidos. Parametrų vertinimas MK metodu. Modelio adekvatumo tikrinimas. Hipotezės apie parametrų reikšmigumą tikrinimas. Determinacijos koeficiento R 2 skaičiavimas, jo prasmė, ryšys su koreliacijos koeficientu ρ. Praktinė dalis. Duomenų įkėlimas. Aprašomoji statistika. Daugialypės tiesinės regresijos modelis. Prognozė ir prognozės pasikliautinasis intervalas. Išvados. Literatūros sąrašas. Priedas.


Darbo uždaviniai:

Pateikti aprašomąją statistiką;

Sudaryti daugialypės tiesinės regresijos modelį ir įvertinti jo parametrus;

Naudojant sudarytą modelį atlikti anglies monoksido kiekio cigaretėse prognozę.

Kada formule yi = β0 + β1xi 1 + β2xi 2 + + βkxi k + ei , i = 1, , n. užrašytas daugialypės regresijos modelis turi daug kintamųjų, skaičiuojamas pataisytas determinacijos koeficientas:

Šiame darbe naudojami duomenys, reikalingi sudaryti daugialypės tiesinės regresijos modeliui ir prognozei atlikti, yra tekstinio formato faile kuris patalpintas internete adresu:

>Importuojami duomenys iš .txt failo į R programą.

Minimalus anglies monoksido kiekis (y) yra 1,5mg, maksimalus – 23,5mg, vidutinis – 12,53mg. Vidurinė reikšmė – 13mg.

Minimalus dervų (x2) kiekis yra 1mg, maksimalus – 29,80mg, vidutinis – 12,22mg. Vidurinė reikšmė – 12,8mg.

Minimalus nikotino kiekis yra 0,13mg, maksimalus 2,03mg, vidutinis – 0,87mg. Vidurinė reikšmė – 0,9mg.

Minimalus cigaretės svoris yra 0,78g, maksimalus – 1,16g, vidutinis – 0,97g. Vidurinė reikšmė – 0,95g.

Apskaičiuojamos kintamųjų y, x2, x3, x4 sklaidos charakteristikos. Skaičiuojamas imties plotis, kuris parodo reikšmių intervalą, kuriame kinta kiekvieno parametro reikšmės.

Modelį vertinsiu iš naujo nes, iš 3 kintamųjų tik vienas yra reikšmingas. Kai pr.value yra >0,05, tai šis kintamasis yra nereikšmingas, todėl jį atmetame. T.y. jis nedaro įtakos anglies monoksido kiekiui. Atmetus nereikšmingus kintamuosius, modelis yra vertinamas iš naujo tik su likusiu reikšmingu kintamuoju x2. Atmetami x3 ir x4.

Gautą lygtį galima interpretuoti taip – padidėjus x2 vienu vienetu, anglies monoksido kiekis padidės 0.80098. Taigi iš visų tirtų nepriklausomų kintamųjų didžiausią įtaką anglies monoksido kiekiui turi x2 – dervų kiekis.

Determinacijos koeficientas kinta nuo 0 iki 1, kuo jo reikšmė didesnė, tuo geresnis modelis. Jei R-squared>0,8 tai modelis laikomas pakankamai adekvačiu. Šiuo atvėju determinacijos koeficientas R-squared yra 0.9168, taigi modelis yra labai adekvatus.

Pradinio modelio parametrai β buvo tokie: x2=0.9626; x3=-2.6317; x4=-0.1305. Įvertinus modelį iš naujo ir atmetus x3 ir x4 parametrus : x2=0.80098. Galima pastebėti, kad įvertinus modelį iš naujo parametras x2 pamažėjo.

  • Matematika Kursinis darbas
  • Microsoft Word 1237 KB
  • 2016 m.
  • Lietuvių
  • 19 puslapių (2273 žodžiai)
  • Universitetas
  • Andrius
  • Daugialypės tiesinės regresijos analizė kursinis darbas (2)
    10 - 7 balsai (-ų)
Daugialypės tiesinės regresijos analizė kursinis darbas (2). (2016 m. Gegužės 16 d.). https://www.mokslobaze.lt/daugialypes-tiesines-regresijos-analize-kursinis-darbas-2.html Peržiūrėta 2018 m. Vasario 21 d. 20:52
×