Regresinė analizė: Ar sužaistų žaidimų skaičius ir tai kiek metų futbolininkai žaidžia turi įtaką pelnytų įvarčių skaičiui tarptautinėse rungtynėse



Regresinė analizė: Ar sužaistų žaidimų skaičius ir tai kiek metų futbolininkai žaidžia turi įtaką pelnytų įvarčių skaičiui tarptautinėse rungtynėse.
Tema: Ar sužaistų žaidimų skaičius ir tai kiek metų futbolininkai žaidžia turi įtaką pelnytų įvarčių skaičiui tarptautinėse rungtynėse.
Darbo eiga: Atlikti porinę regresinę analizę pasirinktiems duomenims ; Atlikti daugialypę tiesinę regresinę analizė pasirinktiems duomenims; Atlikti daugialypę tiesinę regresinę analizė pasirinktiems duomenims su pseudokintamaisiais. (11 punktų) ; Atlikti logistinę regresinę analizė pasirinktiems duomenims. ; Remiantis gautais modeliais, atlikti prognozę savo nuožiūra pasirinktiems taškams: Porinė regresija , Daugialype regresija , Pseudo kintamųjų regresija , Logistine regresija.
Duomenų masyvas: Pasirinkti 50 UEFA Nations League žaidėjų, kurie per karjerą pelnė daugiausiai įvarčių.
Nepriklausomas kintamasis: lyga, žaidimų skaičius, kiek metų žaidžia, įvarčiai per žaidima.
Šis kategorinis buvo suskirstytas į į skirtingas kategorijas. Aš jas užkodavau kaip conmebol lyga = 1 ; concacaf lyga =2 ; eufa lyga = 3 ; caf lyga = 4 ; afc lyga = 5.
Neišėjo pasidaryti 11 skirinių, todėl gavosi tik 5 ir aš atlikau darba tik su 5.
1. Normalumo testas priklausomajam kintamajam ( įvarčiai ), tikrinsime ar turi normalūjį skirstinį:
Jei Sig/p= > uz reiksmingumo lygmeni (alfa 0,05) 0 hipotezes negalim atmesti
Pagal Kolmogorovo-Smirnovo 0,014<0,05 kas reiškia jog domenys neturi normaliojo skirstinio. Taip pat pagal Shapiro vilko 0,00 < 0,05 reiškia jog domenys taip pat neturi normaliojo skirstinio.
Iš histogramos galime matyti, jog duomenys nera pasiskirte tolygiai varpelio viduryje, todėl galime drasiai teigti jog duomenys neturi normaliojo skirstinio. Tai gali būti dėl daugelio priežasčių tokių kaip pakankamai mažo duomenų masyvo.
2. Sudarytas regresinės analizės modelį, pasirenkame įvarčius kaip priklausomajį kintamajį ir lyga, zaidimus ir kiek metų žaidžia kaip nepriklausomuosius.
Kadangi šiuo atvėju 0,131 < 0,25 galime teigti, jog modelis yra netinkamas.
Taip pat kiek metų žaidžia taip pat nėra reikšmingas, nes Sig/p
Kadangi Durbino-Watsono koficientas yra 0,291 o tai yra nepatenka į intervalą nuo 1.5 iki 2.5, galime teigti jog autokoreliacijos tarp duomenų yra, ir yra gan didelė.
Pradėsime tikrinti išskirtis nuo Cook‘o mato, matome jog jis yra mažiau uz 1 0,074<1. Tai reiškia jog Cook‘o matas neparodo jokių išskirčių. Toliau tikriname standartizuotas liekanas ir matome, jog jos yra intevaale nuo -2,047 iki 3,418 , kadangi intervalas maximumo taške viršija 3, iš to galime teigti jog vyrauja išskirtys ir būtu gerai jas pašalinti ir pabandyti sudaryti modelį dar kartą.
Pašalinus liekana gauname, jog standartizuota liekana patenka į intervalą (-3;3) -1,563 ir 3,408 , dabar išskirčių nebėra.
Pašalinus liekana antra karta gauname jog standartizuota liekana patenka į intervalą (-3;3) -1,470 ir 2,132 , dabar išskirčių nebėra.
Iš grafiko yra matoma, jog grafikas yra heterostedastiškas, tai reiškia, jog liekanos neturi priklausomybės nuo reikšmių. Nubrėžus liniją ties 0 matome jog duomenys didėja.
Matome, jog Sig. Reikšmės visais atvėjais yra per didelės Sig>alpha(0,05) tai reiškia, jog jie yra nereikėšmingi.
Pašalines žaidimus ir apkeitus juos su kiek metų žaidžia reikšmės padidėjo ir tuo pačiu padidėjo jų nereikšmingumas. Tokiu atvėju šis būdas yra neveiksmingas.
Matome, jog reikšmingų yra tik žaidimai ir constant (įvarčiai), visos kitos nereikšmingos. Šaliname labiausiai netinkantį šiuo atvėju lyga1.
Matome, jog reikšmingų yra tik žaidimai ir constant (įvarčiai), visos kitos nereikšmingos. Šaliname labiausiai netinkantį šiuo atvėju lyga5.
Matome, jog reikšmingų yra tik žaidimai ir constant (įvarčiai), visos kitos nereikšmingos. Šaliname labiausiai netinkantį šiuo atvėju kiek metų žaidžia.
Matome, jog reikšmingų yra tik žaidimai ir constant (įvarčiai), visos kitos nereikšmingos. Šaliname labiausiai netinkantį šiuo atvėju lyga4.
Pseudo kintamūjų reikšmingumas nėra reikšmingas todėl. Pseudo kintamūjų analizė nereikšminga ir su ja negalima daryti jokių prognozių
2) Y=B+X1*B1+X2*B2... kadangi buvo nereikšmingų reikšmių, jas pašalinus gauname tokią formulę Y= 56,609 + x1*0,156 ; didėjant x1 reikšmei Y (priklausomasis) taip pat didėja kas 0,156. Gavosi porinės regresijos modelis.
3) Pseudo kintamūjų reikšmingumas nėra reikšmingas. Todėl Pseudo kintamūjų analizė nereikšminga ir su ja negalima daryti jokių prognozių
Atlikta analizė rodo kad sužaistų žaidimų skaičius, bei kiek metų žaidžia nėra priklausomi arba jų įtaka yra labia nedidelė pelnytų įvarčių skaičiui, bei kiti pasirinkti nepriklausomieji tyrimo metu išaiškėjo buvo nereikšmingi.
- Microsoft Word 114 KB
- 2022 m.
- Lietuvių
- 9 puslapiai (1579 žodžiai)
- Universitetas
- Arnas
-