Pereiti prie turinio

KTU Didžiųjų duomenų mokykla. Kas naujo 2020-aisiais arba ką turėtume rasti duomenų analitiko įrankių dėžėje?

Matematikai | 2020-10-13

Įmonių darbas su didžiaisiais duomenimis pastaruoju metu tapo bene įprastu dalyku ir jau ne daug ką nustebina ši inovacija. Todėl pasakoti verslui apie tai, kad būtina įveiklinti duomenis, jei nori būti konkurencingi rinkoje, tikrai nereikia. Dabar svarbiausias klausimas, ko gero, yra – kaip tai padaryti.

„Ir štai čia jau galime kalbėti apie inovacijas. Kasmet atsiranda vis naujų metodų ir technikų, kaip didžiuosius duomenis paversti pinigais arba verte. Kas bus pasirinkta – ar tai verslo korporacijų siekiai „atsikąsti“ didesnį rinkos pyrago gabalą, ar viešojo sektoriaus įstaigų (kad ir ligoninių) noras tvarkytis su pacientų duomenimis, o gal net siekis diagnozuoti ligas – tai priklausys nuo organizacijos pobūdžio“, – įsitikinęs ką tik įvykusios „KTU Big Data School 2020“ (liet. KTU Didžiųjų duomenų mokykla 2020) vadovas KTU Matematikos ir gamtos mokslų fakulteto (MGMF) docentas Tomas Iešmantas.

Mokslininko teigimu, vienaip ar kitaip, būtina sekti naujausias tendencijas ir nuolat semtis žinių apie tai, kas naujo ir progresyvaus atsiranda šiame moksle.

Svarbu – nuolatinis tobulėjimas

Dovilė Komolovaitė KTU duomenų mokslininkė
Dovilė Komolovaitė

Alberto Einšteino patarimas nenustoti klausinėti ir neprarasti švento smalsumo ir dabar labai aktualus – kaip ir bet kuri sritis, didžiųjų duomenų technologijų laukas, taip pat nuolat keičiasi. Pasak T. Iešmanto, labai svarbu nelaikyti šventa konstanta to, ką specialistas išmoko studijų metu, labai svarbu nuolat domėtis, kas vyksta šio mokslo arenoje, skaityti, semtis žinių ir idėjų iš progresyvių kolegų.

Šiai idėjai vienareikšmiai pritaria ir „Centric IT Solutions Lithuania“ jaunesnioji duomenų mokslininkė Dovilė Komolovaitė, kartu su kolegomis dalyvavusi „KTU Big Data School 2020“: „mokytis buvo ir bus svarbu. Knygų skaitymas, praktinis pritaikymas, eksperimentavimas, naujienų sekimas ir moksliniai renginiai ar bendravimas su kitais duomenų mokslininkais yra tik dalis iš daugybės būdų, kaip plėsti savo akiratį ir papildyti žinių aruodą“.

Renginio metu kalbintas Valstybinės mokesčių inspekcijos (VMI) Analitinio modeliavimo skyriaus specialistas Kęstutis Jaudzemas taip pat įsitikinęs, kad mokytis yra labai svarbu: „norint būti geru analitiku yra reikalingas nuolatinis tobulėjimas, nes rinkos poreikiai, lygiagrečiai su naujausiomis technologijomis, sparčiai keičiasi“.

Kęstutis Jaudzemas KTU
Kęstutis Jaudzemas

Šiai idėjai pritaria ir kredito rizikos analitikas, Lietuvos centrinės kredito unijos atstovas, Jonas Rapsikevičius. Jis pamini, kad net viena iš Europos Sąjungos kontekstinių krypčių yra mokymasis visą gyvenimą: „nuolatos tobulėji, nuolatos ieškai naujovių, ieškai naujų galimybių. Galbūt ne viską, ką išgirsiu šiandien, galėsiu tiesiogiai pritaikyti savo darbe, bet tikrai kyla idėjų, ką galima būtų integruoti į mūsų veiklą“.

Sudie, tradicine analitika

Pasak T. Iešmanto, neretai duomenų analitikos srityje dirbantys specialistai susiduria su metodų taikymo ribotumais, tačiau ne visada esama įgūdžių ar žinių šiems ribotumams ar trūkumams ištaisyti. Taip pat vis atsiranda naujų technikų ar idėjų, kurias integravus į įmonės duomenų valdymo procesus, galima pasiekti dar geresnių rezultatų.

„Vis geriau suprantama duomenyse esančios informacijos reikšmė ir vertė, tačiau šiai reikšmei ir galimam panaudojimui atskleisti reikia specifinių įgūdžių, grįstų gerai išvystytais analitiniais gebėjimais“, – vardija T. Iešmantas.

O dar turint omenyje duomenų kiekį, kuris yra tikrai per didelis, kad patogiai tilptų į tai, ką galėtume pavadinti tradicine duomenų analitika, – įmonės turi pasitelkti pažangiausius metodus ir nepamiršti esminio dalyko – sumanių specialistų tam, kad sėkmingai išplauktų iš duomenų jūros.

Jonas Rapsikevičius KTU MGMF
Jonas Rapsikevičius

Būtent tokių įgūdžių ir žinių siekiantys dalyviai galėjo ir šiemet pasisemti iš „KTU Big Data School 2020“ lektorių. Sesijų metu buvo aptartos didžiųjų duomenų analitikos ir dirbtinio intelekto finansų bei bankų sektoriuose, laiko eilučių klasifikavimo ir klasterizavimo, neuroninių tinklų ir kitos temos.

Mokykloje dalyvavusio „Swedbank“ programinės įrangos inžinieriaus dr. Donato Kavaliausko teigimu, skaitmeninių duomenų srautas tik didėja, o jį suprasti ir analizuoti tampa vis sudėtingiau, tad galimybė žinias gilinti ir taip prisidėti prie proveržio šioje srityje yra labai svarbi.

Universalių įrankių nėra

„Swedbank“ specialistas taip pat pabrėžia, kad informacinių technologijų ir duomenų sritys pastaruoju laikotarpiu „sprogsta“. Kad beprecedenčiai duomenų kiekiai jau nukarūnavo tradicinę duomenų analitiką – aišku. Kad viskas greitai keičiasi ir nuolat reikia vytis sprintuojančias technologijas – taip pat aišku. Visgi, ar yra būdas, kaip spręsti visus versle ar viešajame sektoriuje kylančius uždavinius pasitelkiant didžiuosius duomenis?

Pasak „KTU Big Data School 2020“ vadovo T. Iešmanto, universalių įrankių nėra. Egzistuoja daugybė metodų ir technikų ir gana aiškios tendencijos. Tik tam, kad tas technikas įvaldytų, reikia turėti tam tikrų žinių bagažą, kurį jau galėtume vadinti universaliu.

Docentas paaiškina: „didžiųjų duomenų specialisto įrankių dėžėje galėtume ieškoti analitinio mąstymo ir kūrybiškumo, programavimo įgūdžių, verslo sistemų išmanymo, darbo su duomenų analitikos sistemomis patirties, mašininio mokymosi metodų išmanymo ir, žinoma, senosios gerosios matematikos“.

„Darbui su didžiaisiais duomenimis būtinos yra matematikos ir matematinių mokslų, tokių kaip stochastiniai procesai, optimizavimo teorija, statistika ir algoritmų žinios. O tada jau galima nerti giliau“, – įsitikinęs T. Iešmantas.

doc. dr. Tomas Iešmantas KTU
Tomas Iešmantas

Kaip nemažiau svarbią sėkmingo specialisto atributą, „KTU Big Data School 2020“ dalyvavę praktikai, įvardija komunikacinius gebėjimus. „Praktikoje atsiranda būtinybė tobulinti savo bendravimo įgūdžius.  Dirbant šioje, kaip, beje, ir bet kurioje kitoje srityje, visada teks bendrauti su kitais. Pavyzdžiui, neišsakymas savo nuomonės, ar nesutarimas dėl naudojamų metodų gali visą projektą vesti į pražūtį,“ – svarsto D. Kavaliauskas.

Tendencijos aiškios

Daugiau nei akivaizdu, kad praktinės ir teorinės problemos, kurios sprendžiamos tiek pramonėje, tiek kuriant naujas technologijas didžiųjų duomenų srityje, tampa vis sudėtingesnės. Progresui šiame nuolat kintančiame lauke užtikrinti dabar ir dar kurį laiką ateityje, pasitelkiamos kelios pagrindinės technologijos.

„Pirmagalyje rikiuojasi anksčiau minėti dirbtinis intelektas ir mašininis mokymasis (šių dviejų dalykų draugija – pažangiausia programinė įranga, tokia kaip „Python“, SAS, R ir kt.), neuroninių tinklų taikymai kompiuterinėje regoje ir kalbos apdorojime, nuo laiko priklausomų finansinių procesų modeliai“, – vardija docentas T. Iešmantas.

Pokalbį baigdamas mokslininkas džiaugėsi, kad organizacijos ir įmonės nuosekliai tobulina savo duomenų analizę ir platformas, investuoja į naujos kartos specialistus, galinčius sėkmingai tvarkytis su duomenimis, o specialistai, savo ruožtu, nuolat mokosi ir priduria, kad kitais metais galime tikėtis kur kas didesnio KTU Big Data School renginio.