Ne visada užtenka vien išmanyti statistiką, mašininį mokymąsi, programavimą ir t.t., kad greitai gautum duomenų analitiko ar mokslininko darbą. Esminis tave reprezentuojantis dalykas yra tavo atliktų darbų „portfolio“. Geras gyvenimo aprašymas yra svarbu, tačiau būtent atlikti darbai leidžia darbdaviui susidaryti aiškesnį vaizdą apie tave ir tavo potencialą. Šiame įraše plačiau pakalbėsime apie tai, koks turėtų būti „portfolio“, norint įsidarbinti didžiųjų duomenų srityje.

 

Kodėl „portfolio“ yra toks svarbus?

Visų pirma, „portfolio“ yra svarbus ne tik ieškant darbo.  Kurdamas savo „portfolio“, tu įgauni svarbios patirties ir praktikos. Be to, jei savo darbus keli į visiems matomą puslapį ar socialinį tinklalapį, didėja galimybė būti pastebėtam ir įvertintam dar net nepradėjus dirbti. Labai reali situacija – kažkas dirbantis su duomenimis, „googlina“ ieškodamas problemos sprendimo (taip taip, net ir profesionalai tai daro) ir randa tavo pasidalintu sprendimo būdu. Jei toks žmogus ieškotų kolegos ar asistento, šansai, kad susisieks su tavimi, smarkiai išauga.

 

Kai reikia „turėti patirties“

Net ir samdydamos pradedančiuosius darbuotojus, kompanijos pageidauja, kad pretendentai turėtų nors truputį realios patirties. Tačiau tai nereiškia, kad būtinai turi būti jau kažkur dirbęs. Visiškai užteks individualių projektų, net jei rezultatas ir nebūtų tobulas. Darbdaviui daug svarbiau pamatyti, kaip tu elgeisi, susidūręs su problemomis, sužinoti, ko išmokai iš konkretaus projekto ir pan.

 

 

Kokius projektus verta įtraukti į „portfolio“?

Duomenų mokslo ir analitikos sritis yra be galo plati, todėl gali būti sunku suprasti, kokius projektus darbdavys nori matyti, o kokių ne. Atsakymas paprastas – darbdavys nori matyti tokius tavo projektus, su kuriais tau pačiam buvo labai įdomu dirbti. Nepatingėk aprašyti projekto, paminėk, kodėl būtent ši sritis tave patraukė ir kuo buvo įdomūs rezultatai. Ir žinoma, pridėk išsamių ir aiškių vizualizacijų.

Jei nežinai, kaip internete rasti įdomios informacijos savo projektui, pasidomėk „webscraping‘u“ – informacijos surinkimu iš interneto svetainių. Tam puikiai tiks „Python“  programavimo kalba.

 

Ko neįtraukti į savo „portfolio“

Internete gali rasti duomenų rinkinių, kuriuos naudodamas gali treniruotis dirbti su didžiaisiais duomenimis. Pavyzdžiui MNIST  ar „Iris“  yra puikūs laisvai prieinami duomenų rinkiniai internete treniruotėms. Tačiau tegu tai ir lieka treniruotės. Treniruodamasis su šiais duomenimis, neparodysi, kuo esi geresnis už kitus, darančius tą patį. Geriau į „portfolio“ įtraukti projektus, kurie yra individualūs ir sugalvoti tik tavo paties.

 

„Portfolio“ neturi būti baigtinis

Jei jau esi atlikęs šaunių projektų ir turi susikūręs pavyzdinį „portfolio“ – nesustok. Net pradėjęs vaikščioti į darbo pokalbius, toliau plėsk savo projektų sąrašą ir, atradęs kažką naujo, tobulink jau sukurtus projektus. Kiekvienas naujas projektas, kiekvienas darbo pokalbis yra nauja patirtis. Mokykis iš šių patirčių, net jei nepasiseka, nes tik tada tu tobulėsi.

 

Aptarėme, koks turėtų būti duomenų analitiko ar mokslininko „portfolio“ ir kodėl taip svarbu jį turėti. Ateityje pasidalinsim įžvalgomis apie socialinius tinklus ir kaip jie gali padėti papildyti tavo „portfolio“.