Duomenų analizės konspektas egzaminui


Matematikos konspektas. Duomenų analizės metodų ir programinių priemonių apžvalga. Duomenų analizės programinės įrangos apžvalga Duomenų analizės programinės įrangos klasifikacija. Duomenų analizės programų bibliotekos parašytos. Universalios matematikos uždavinių sprendimo sistemos. Duomenų analizės sistemos. Ekspertinės duomenų analizės sistemos. Excel ir mathcad statistinės analizės priemonės. Excel ir MathCad pagrindinės duomenų analizės funkcijos. Statistinis stebėjimas. Populiacija ir imtis. Imties sudarymo būdai. Duomenys ir matavimo skalės. Statistikos objektas. Statistinio tyrimo. Organizavimo požiūriu. Atskaitomybę ir specialiai organizuotus statistinius stebėjimus. Valstybinė ir žinybinė atskaitomybė. Metinė ir einamoji. Oficialiąją statistiką. Respublikoje tvarko. Oficialioji statistika. Pagrindiniai oficialiosios statistikos uždaviniai. Kitą valstybės statistiką Lietuvos Respublikoje gali tvarkyti. Specialūs statistiniai stebėjimai. Ekspediciniu būdu. Korespondenciniu būdu. Anketiniu būdu. Pagal statistinio stebėjimo vykdymo laiką. Einamasis stebėjimas. Vienkartinio stebėjimo. Pagal duomenų gavimo būdą. Betarpiško stebėjimo. Dokumentinio stebėjimo. Skiriama žodinė , saviskaitinė ir pareikštinė apklausa. Žodinės apklausos. Saviskaitinės apklausos. Pareikštinės apklausos. Generalinėmis aibėmis , statistinėmis visumomis. Populiacijos apibūdinimas. Populiacijos dydžiu. Statistiniai tyrimai. Ištisinis tyrimas. Pasirinktinis tyrimas. Nimties koeficientu. Imties paklaida. Atsitiktinė paklaida. Sistemingąją paklaidą. Imties iškreiptis. Trumpai pakartosime svarbiausius faktus apie pasirinktinius tyrimus. Imčių kintamumu. Kvotinės imtys. Kvotinės imties trūkumas. Klausėjų įtaka. Žmogaus įsikišimas į imties sudarymą gali ją iškreipti. Atsitiktinės imtys. Atsitiktinės imties. Paprastoji atsitiktinė imtis. Sluoksninė imtis. Daugiapakopė atsitiktinė imtis. Bandomoji grupė ir kontrolinė grupė. Kontroliuojamuoju eksperimentu.


Taikomosios statistikos metodai plačiai taikomi inžinerijoje, medicinoje, versle, valstybės valdyme, sociologijoje ir t.t. Praktiškai taikyti šiuos metodus labai palengvina šiuolaikinės duomenų analizės sistemos, jungiančios visus reikiamos informacijos gavimo iš duomenų žingsnius: duomenų įvedimo, redagavimo ir saugojimo; statistinės duomenų analizės ir sprendimų priėmimo; ataskaitų rašymo ir rezultatų grafinio vaizdavimo;

Šis modulis, tai įvadas į tris duomenų analizės sistemas: SPSS, SAS ir MATHCAD. Jame pateikiama šių sistemų struktūra, vartotojo instrumentai, duomenų tipai, duomenų perkėlimas iš kitų formatų duomenų failų, duomenų tvarkymo priemonės, darbas su duomenų analizės procedūromis, nesudėtingų duomenų analizės uždavinių sprendimo pavyzdžiai.

Modulio tikslas supažindinti su duomenų analizės sistemų klasifikacija ir sistemų SPSS, SAS ir MATHCAD struktūra, vartotojo instrumentais, duomenų tipais, duomenų perkėlimo iš kitų formatų duomenų failų ir duomenų tvarkymo priemonės bei duomenų analizės procedūromis. Išstudijavę modulio medžiagą jūs galėsite : perkelti duomenis iš kitų formatų duomenų failų; tvarkyti duomenis ir juos paruošti statistinei analizei; atpažinti duomenų tipus ir priskirti kintamiesiems parametrus; savarankiškai spręsti nesudėtingus duomenų analizės uždavinius.

Šiuo metu yra sukurta nemažai duomenų analizės programinių priemonių, kurias galima klasifikuoti pagal įvairius požymius: uždavinių sprendimo automatizacijos lygis, funkcinės galimybės, sistemos išplėtimo priemonės, greitaeigingumas, kaina, maksimalus apdorojamos imties tūris ir t.t. Pagal uždavinių sprendimo automatizacijos lygį esamas programines priemones galima sugrupuoti į 4 grupes:

1)Duomenų analizės programų bibliotekos parašytos universaliose programavimo kalbose FORTRAN, PL/1,C, PASCAL ir t.t. Jomis gali naudotis vartotojas turintis atitinkamą kvalifikaciją statistikos ir programavimo srityse. 2)Universalios matematikos uždavinių sprendimo sistemos, kuriose yra duomenų analizės posistemis (MATHCAD, MATHEMATICA, MATLAB ir t.t.).

3)Duomenų analizės sistemos (SAS, SPSS, STATGRAPHICS, STATISTICA ir t.t.). Šios klasės sistemos turi dviejų lygių programines priemones bendravimui su vartotoju: specializuotą programavimo kalbą, skirtą duomenų analizės uždavinių programavimui;tipinių duomenų analizės uždavinių sprendimo posistemį, kurį sudaro dažniausiai naudojamų duomenų analizės procedūrų rinkinys ir programinės priemonės sukuriančios "patogią" darbo aplinką šių programų vartotojui. Ja gali naudotis vartotojas nemokantis programuoti, bet turintis atitinkamą pasiruošimą statistikos srityje.

Plačiau su duomenų analizės sistemomis galima susipažinti Interneto puslapiuose:

SAS SPSS Statgraphics Statistica SYSTAT SigmaStat S-plus Minitab BMDPGenstat

Ekspertinės duomenų analizės sistemos (TABLECURVE 2D, TABLECURVE 3D, MVSV, ABP ir t.t.). Pagrindinis šių sistemų kūrimo tikslas - sumažinti reikalavimus vartotojo pasiruošimo lygiui programavimo ir matematikos srityse. Ekspertinėse sistemose automatizuojami užduoties formulavimo, tinkamo duomenų analizės metodo parinkimo, duomenų analizės, rezultatų interpretavimo ir išvadų formulavimo etapai. Pavyzdžiui, sistema TABLECURVE 2D pati parenka vartotojo pateiktiems duomenims geriausią regresijos lygtį iš 3665 galimų variantų ir apskaičiuoja jos koeficientų įverčius.

EXCEL IR MATHCAD STATISTINĖS ANALIZĖS PRIEMONĖS:

Nesudėtingai duomenų analizei atlikti gali būti naudojami ir universalios paskirties matematikos paketai MathCad arba Microsoft Excel.

Excel aplinkoje statistinę duomenų analizę galima atlikti dviem būdais:

1)Sukurtuose darbo lapuose naudoti Excel standartines (built-in) funkcijas.

2)Naudoti specialų Excel duomenų analizės uždavinių posistemį, kuris iškviečiamas ToolsData Analysis komanda.

MathCad pakete galima rasti ne tik standartinių funkcijų, atliekančių statistinę duomenų analizę, bet ir programų statistinės analizės uždaviniui spręsti. Jos yra resursų centro praktinės statistikos skyrelyje (HelpResource CenterPractical Statistics).

Excel ir MathCad pagrindinės duomenų analizės funkcijos

2. Atsitiktiniu dydžiu skirstiniai: 2.1. Diskretieji skirstiniai: 2.1.1. Binominis skirstinys (Binomial distribution)

Microsoft Excel duomenų analizės posistemį sudaro 19 uždavinių:Anova: Single Factor - vienfaktorinė dispersinė analizė. Anova: Two-Factors With Replication - dvifaktorinė dispersinė analizė (faktoriai su kartotiniais stebiniais).

Anova: Two-Factors Without Replication - dvifaktorinė dispersinė analizė (faktoriai be kartotinių stebinių).

Correlation - koreliacija. Covariance - kovariacija. Descriptive Statistics - aprašomoji statistika.

Exponential Smoothing - eksponentinis glodinimas. F_Test Two-Sample for Variances - dviejų imčių F kriterijus dispersijoms. Fourier Analysis - Furjė analizė. Histogram - histograma. Moving Average - slenkamasis vidurkis.

Random Number Generator - atsitiktinių skaičių generatorius. Rank and Percentile - rangas ir procentilis.

Regression - regresija. Sampling - imties ėmimas. t_Test Paired Two Sample for Means - hipotezės apie dviejų suporuotų imčių vidurkių skirtumą tikrinimas. t_Test Two Sample Assuming Equal Variances - hipotezės apie dviejų imčių vidurkių skirtumą tikrinimas, kai dispersijos lygios. t_Test Two Sample Assuming Unequal Variances - hipotezės apie dviejų imčių vidurkių skirtumą tikrinimas, kai dispersijos yra nelygios. z_Test Two Sample for Means - hipotezės apie dviejų imčių vidurkių skirtumą tikrinimas.

  • Matematika Konspektai
  • 2015 m.
  • Lietuvių
  • 35 puslapiai (9137 žodžiai)
  • Matematikos konspektai
  • Microsoft Word 714 KB
  • Duomenų analizės konspektas egzaminui
    10 - 5 balsai (-ų)
Duomenų analizės konspektas egzaminui. (2015 m. Lapkričio 22 d.). http://www.mokslobaze.lt/duomenu-analizes-konspektas-egzaminui.html Peržiūrėta 2016 m. Gruodžio 03 d. 02:29