Lapkričio 25 d. atvirą paskaitą apie „Big Data“ analitiką taikomosios matematikos studentams ir kitiems besidomintiems skaitė programuotojas Ramūnas Balukonis, dirbantis įmonėje „Adform“. Ši kompanija – didžiausia Skandinavijos šalyse programinę įrangą skaitmeninei reklamai kurianti įmonė, taip pat – viena iš trijų organizacijų, laimėjusių „Best Employers“ titulą 2014 m. Lietuvoje. Ši paskaita buvo „Adform Academy“ (http://academy.adform.com) dalis.
Paskaitos metu Ramūnas Balukonis papasakojo apie problemas, kylančias dirbant su „didžiaisiais duomenimis“, pavyzdžiui, ką daryti, kai duomenys nebetelpa viename serveryje, kokie skirtumai tarp įvairių „didiesiems duomenims“ apdoroti skirtų įrankių ir technologijų, kokia ilgalaikio investicijų planavimo į infrastruktūrą svarba. Klausytojai turėjo ne tik puikią galimybę sužinoti apie tai, kur galėtų pritaikyti matematikos ir informatikos žinias, jei dirbtų duomenų analizės srityje, bet ir gauti atsakymus į aktualius klausimus bei sužinoti daugiau apie galimybes „Adform“.
Paskaitos pradžioje pranešėjas trumpai priminė apie 4 esmines „didžiųjų duomenų“ savybes: duomenų kiekį, kaupimo greitį, įvairovę ir vertę, su kuriomis susijusios tiek „Big Data“ galimybės, tiek iššūkiai. Kiekvieną dieną vien per „Adform“ serverius yra atliekama 2 mlrd. transakcijų, kurių didžiąją dalį sudaro reklamų parodymai (angl. — „impressions“). Tai – 4 kartus daugiau nei kasdienis „Twitter“ žinučių kiekis (500 mln.) visoje Žemėje. Dėl šių 2 mlrd. transakcijų kasdien sugeneruojama 1,4 TB duomenų, kuriuos reikia apdoroti. Akivaizdu, kad tokie duomenų kiekiai greitai užpildo serverius. Žvelgiant iš ilgalaikės perspektyvos, greiti šios problemos sprendimo būdai, pvz., senesnių duomenų pašalinimas arba serverių keitimas brangesniais, nėra optimalūs. „Adform“ komandai reikėjo tokio sprendimo, kad prireikus, turimą duomenų „sandėlį“ būtų galima greitai ir nebrangiai išplėsti, kad vartotojai nenukentėtų dėl sistemos prastovų ar sulėtėjusio veikimo, kad informacija apie vartotojų veiksmus būtų kuo greičiau pakraunama į sistemą ir analizuojama, ir t. t. Optimalų sprendimą, tenkinantį visus šiuos reikalavimus, sukūrė pati „Adform“ komanda. Ramūnas Balukonis taip pat pasakojo, kokie kriterijai buvo svarbūs įmonei, tiriant duomenų bazių valdymo paslaugų iš skirtingų tiekėjų siūlomas galimybes, kodėl įmonė pasirinko „Vertica“ siūlomą sprendimą, kokios išvados padarytos tyrimo pabaigoje. Svečias iš „Adform“ įspėjo, kad su turimais duomenų kiekiais perėjimas nuo vienos duomenų bazių valdymo sistemos prie kitos – neprarandant paslaugų kokybės pereinamuoju laikotarpiu – tai lyg vagono perkabinimas nuo vieno važiuojančio traukinio prie kito. Tačiau sėkmingai įveikus šį procesą, darbas tampa daug efektyvesnis, pvz., tam tikrai procedūrai, kuriai anksčiau reikėjo 86 kodo eilučių, dabar pakanka tik trijų.
Paskaitos pabaigoje pranešėjas papasakojo apie praktikos ir akademinių projektų vykdymo galimybes „Adform“ bei atsakė į paskaitos dalyviams rūpimus klausimus.
Matematikos ir gamtos mokslų fakultetas dėkoja „Adform“ programuotojui Ramūnui Balukoniui už įdomią paskaitą, o personalo partnerei Jurgitai Urbelytei – už pagalbą paskaitą planuojant!
APC veiklos koordinatorė Kristina Vaznelytė
Matematikos ir gamtos mokslų fakulteto dekanatas