Vieno kintamojo statistinė analizė su STATGRAPHICS programa (2)


Vieno kintamojo statistinė analizė su. Nepilnamečių , įtariamų padarius nusikalstamas veiklas skaičius , tenkantis 100 tūkst. Duomenų įvedimas vieno kintamojo analizei Duomenys. Sklaidos diagrama Scatterplot. Sklaidos diagramos vertikalus sutraukimas Vertical jittering. Aprašomoji statistika Summary Statistics. Centrinės tendencijos matai. Sklaidos ir kitimo matai. Robastinės duomenų analizės problemos. Koncentracijos lygio grafikas. Vinzorizuotas standartinis nuokrypis. Tarpkvartilinis užmojis Apatinė sekstilė. − 6 sekstilė. Asimetrinis neigiamas kairiašonis skirstinys. Asimetrinis teigiamas dešiniašonis skirstinys. Mūsų atveju iš grafiko gauta moda gali būti 1581 1582 1583 1584 1585 1586 1857 1588. Modos grafiko variacijos. Modos grafiko variacijos moda gali būti. Teigiamas ir neigiamas ekscesas bei normalusis skirstinys. Mūsų atveju gautas eksceso koeficiento grafinis vaizdas. Sandartizuotas eksceso koeficientas. Daugiau esminis nei neesminis. Trijų sigmų taisyklės grafinis vaizdavimas. Lango nustatymai , leidžiantys pasirinkti norimus rodiklius. Stačiakampio diagrama Box and Whisker Plot. Stačiakampio diagramos variacijos atvejis kai sekoje yra dvi negriežtos anomalijos su „ patikimu “ vidurkiu. Stačiakampio diagramos nustatymas Kryptis. Dažnio reikšmių parinktys Grupių skaičius. Dažnio histograma Frequency Histogram. Varpo formos histograma. Dažnio reikšmių ir diagramos tipo parinktys Grupių intervalų skaičius. Kamieno ir lapų diagrama. Pažymėti išskirtis Flag Outliers. Įtraukti normalias ribas. Kvantilių diagrama Quantile Plot. Normaliojo tikimybinio skirstinio diagrama Normal Probability Plot. Pritaikyta linija Fitted Line. Normaliojo skirsnio diagrama su 95 % ribomis.


Statgraphics – tai statistikoje plačiai paplitusi kompiuterinė programa, kurioje yra itin didelis statistikai reikalingų funkcijų bagažas. Programos pirmoji versija yra išleista 1980 metais daktaro Neil‘o Polhemus‘o. Šis profesorius sukūrė šia programą, bedirbdamas Princetono Universitete, Amerikoje, norėdamas palengvinti statistikos darbą, kuris tuo metu buvo ganėtinai varginantis. Ši programa yra itin populiari statistikoje iki šių dienų – paskutinis programos atnaujinimas Statgraphics XVII buvo išleistas 2015 metais.

Norint įsitikinti ar tiriama visuma vienarūšė ar joje yra netipinių (griežtų ir negriežtų stebinių) tikslinga pasinaudoti stačiakampe diagrama. Jos dėka bus galima įvertinti kokius stebinius pašalinti iš tiriamos populiacijos. Mūsų atveju, už stačiakampio ir „ūsų“ ribos jokioje diagramos pusėje nėra jokių kvadratinių figūrėlių. Todėl nėra nei griežtų ir negiežtų anomalijų.

Atliekant vieno kintamojo analizę, imame tik vieną duomenų stulpelį, kur stebinių skaičius n = 2 ir daugiau.

Duomenys (Data) ─ duomenų stulpelyje pateikiamos skaitinės reikšmės, kurios bus apibendrinamos. (pvz.: nepilnamečių, įtariamų padarius nusikaltimus, skaičius).

Mūsų pavyzdyje stebinių skaičius lygus 58, mažiausia reikšmė lygi 336 nepilnamečių, itariamų padarius nusikaltymus skaičius, o didžiausia reikšmė lygi 4729 nepilnamečių.

Sklaidos ir kitimo matai (measure of dispersion) – statistika, parodanti duomenų sklaidą.

Mediana (Median) (centrinės tendencijos matas) – vidurinė sutvarkytos sekos reikšmė, (duomenys surūšiuojami mažėjimo tvarką ─ nuo didžiausio stebinio iki mažiausio arba atvirkščiai). Jei n nelyginis, imties mediana lygi x(0,5+n/2). Jei n yra lyginis skaičius, imties mediana yra dviejų vidurinių reikšmių vidurkis (šio atveju tai dažnai bevardis dydis). Jei imties dažnių skirstinys yra simetriškas vidurkio atžvilgiu, mediana artima vidurkiui arba lygi jam. Vertinant imties centrą, mediana ne tokia jautri išskirtims kaip vidurkis.

Ši statistika dažniausiai naudojama, kai duomenys yra „teigiamai iškreipti didėjimo kryptimi“, tada jie bus arčiau didžiausios reikšmės nei aritmetinis vidurkis. Geometrinį vidurkį prasminga skaičiuoti kai tarp stebinių pasitaiko didelių skaitinių reikšmių. Kadangi aritmetinį vidurkį labai iškreipia anomalinės reikšmės, tokių duomenų „sankaupų centrai“ vertinti be medianos naudojamas ir geometrinis vidurkis. Programa skaičiuoja statistiką, skaičiuodama natūralųjį reikšmių logaritmų vidurkį ir paimdama gautam rezultatui atvirkštinį logaritmą. Toks vidurkis prasmingas tiesioginių užsienio investicijų įvertinimui Lietuvoje, kai santykinai didelės investicijos „ateina“ į keletą savivaldybių o kitos pasitenkina nedidelėmis investicijomis.

Ši statistika dažniausiai naudotina tada, kai kintamojo reikšmės yra teigiamos, jis tiksliau vertina „vidutinį reiškinio kitimo greitį“ nei aritmetinis.

Robastinės duomenų analizės problemos. Tai toks atvejis kai faktiniai duomenys dažnai pasižymi pliūpsniškumu, pvz. „sunkiomis uodegomis“ arba kai duomenys asimetriniai t. y. daug mažų ar didelių stebimo požymio reikšmių (išskirtys) ir pan. Išskirtys ženkliai keičia dispersiją, standartinį nuokrypį, asimetrijos ir eksceso koeficientus. Išskirčių poveikiui mažinti naudojami robastiniai įverčiai – įverčiai, nejautrūs išskirtims. Tai nupjautasis vidurkis (trimmed mean), vinzorizuotas vidurkis (winsorized mean), vinzorizuotas standartinis nuokrypis (winsorized sigma). Tokiais atvejais skaičiuojami sekantys rodikliai:

Nupjautasis vidurkis (Trimmed Mean) (centrinės tendencijos matas) – įvertina imties vidurkį po to, kai pašalinamos didžiausios ir mažiausios duomenų reikšmės užduotos α lygiu (dažniausiai nuo 5 iki 15 proc.):

  • Microsoft Word 2386 KB
  • 2017 m.
  • Lietuvių
  • 48 puslapiai (7199 žodžiai)
  • Universitetas
  • Gintare
  • Vieno kintamojo statistinė analizė su STATGRAPHICS programa (2)
    10 - 2 balsai (-ų)
Vieno kintamojo statistinė analizė su STATGRAPHICS programa (2). (2017 m. Birželio 02 d.). https://www.mokslobaze.lt/vieno-kintamojo-statistine-analize-su-statgraphics-programa-2.html Peržiūrėta 2018 m. Balandžio 23 d. 04:56
×