I MĖNUO – ĮVADAS Į DUOMENŲ ANALITIKĄ
SQL
Duomenų bazių struktūra:
● Lentelių schemos/architektūra
● Lentelių sukūrimas/redagavimas/naikinimas
● Įrašų lentelėje sukūrimas/redagavimas/naikinimas
Duomenų ištraukimas iš duomenų bazių:
● Užklausų sintaksė
● Duomenų filtravimas
● Pagrindinės funkcijos užklausose
● Lentelių jungimas (ryšiai tarp jų)
● Vidinės užklausos
DUOMENŲ TIPAI
TABLEAU / POWER BI
Duomenų prisijungimas ir tvarkymas pasitelkiant Tableau prep / Power Query:
● Duomenų tipų keitimas ir valymas
● Naujų kintamųjų kūrimas
● Lentelių jungimas ir duomenų agregavimas
Vizualus susipažinimas su duomenimis:
● Grafikų kūrimas
● Tinkamos vizualizacijos parinkimas
● Įžvalgų ir tendencijų pastebėjimas
Detali analizė ir naujų kintamųjų kūrimas:
● Naujų suskaičiuotų laukų kūrimas, set’ų ir grupių kūrimas (calculated fields) (Tableau)
● Naujų lentelių skaičiavimas ir parametrų kūrimas (table calculation) (Tableau ir Power BI)
● Skirtingų duomenų tipams pritaikytų filtrų kūrimas (Tableau)
● Lentelių, stulpelių, measures kūrimas naudojant DAX kalbą (Power BI)
Gautų rezultatų apibendrinimas naudojant dashboard ir stories/bookmarks:
● Dashboard estetika
● Spalvų pasirinkimas
● Tikslingas duomenų atvaizdavimas
II MĖNUO – – PYTHON PAGRINDAI IR ĮVADAS Į STATISTINĘ ANALIZĘ
Programavimo kalbos sintaksės pagrindai:
● Duomenų struktūros: string, integer, float, boolean, list, set, dictionary
● Sąlygos: if / elif / else
● Ciklai: for loop, while loop
● Funkcijos: paprastosios ir anoniminės. Funkcijų pritaikymas duomenims. Supažindinimas ir darbas su populiariausiomis duomenų analitikos bibliotekomis (numpy, pandas, math)
● Teorinis supažindinimas su numpy ir math
● Praktinis darbas su pandas biblioteka: duomenų nuskaitymas, transformavimas, tvarkymas ir paruošimas analizei
PYTHON PAGRINDAI IR ĮVADAS Į STATISTINĘ ANALIZĘ
Duomenų vizualizavimas:
● Matplotlib: duomenų vaizdavimas naudojant plot, hist, bar, scatter. Grafikų konfigūravimas
● Seaborn: duomenų vaizdavimas, stilistika. Statistiniai modeliai (teorinis pagrindas, praktinis pritaikymas su scikit-learn biblioteka)
● tiesinė regresija
● klasterizavimas
● pasirinkimo medžiai
BAIGIAMASIS PROJEKTAS, PRISTATYMAS IR ATSISKAITYMAS
REGISTRUOTIS
NUOTOLINIU BŪDU
Bandomoji paskaita