PC Press
O nama
O nama
Pretplata
O nama
Postanite saradnik PC-ja
Kontakt sa redakcijom
PC Press
Novi broj
Novi broj   
Pretrazivanje
Arhiva
Arhiva   
PC Online
PC Plus   
Specijalna izdanja
Pc.biz Pc.biz
PC #204 : Novembar 2013 TehnoGuru

 Naslovna  Sadržaj 
Milan Bašić  

U moru podataka

Enormna količina i raznovrsnost podataka kojima je okružen ne samo poslovni već i svakodnevni život dovela je u prvi plan nove algoritme sposobne da u kratkom vremenu izvuku korisne informacije iz njih. Big Data više nije egzotičan informatički termin, već skup tehnologija sa kojima živimo.

Termin „veliki podaci“, ili kako ćete obično pročitati, Big Data, nije ni blizu tako nov kako ćete u prvom trenutku da pomislite. Još 2001. godine Doug Laney, analitičar tadašnje META Group, (današnji Gartner), je prvi put definisao šta može da se smatra pod ovim terminom. Rekao je da se radi o podacima koji ispunjavaju uslove velikog povećanja količine (Volume), velike brzine „ulaska i izlaska“ podataka (Velocity) i velike raznovrsnosti tipova i izvora podataka (Variety). Uzimajući početna slova engleskih reči za tri glavne osobine, ili ako hoćete „dimenzije“ velikih podataka, došlo se do skraćenice 3V koja je, i posle više od decenije, praktično jedina odrednica za opisivanje termina Big Data.

U 3V svetu

U proteklim godinama potrošilo se puno vremena za još bolje i tačnije opisivanje Big Data modela. Nije izbegnuto, tačnije - nije ni moglo da se izbege, ni traženje odgovora na pitanje koliko podaci koje obuhvatate treba da budu veliki da bi ih nazvali Big Data. U šumi raznoraznih analiza i istraživanja naći ćete mnoge procene za tačku gde Big Data pravila počinju da važe. Pomalo paradoksalno, kako je vreme prolazilo ta granica se polako ali sigurno spuštala da bi danas došla do „skromnih“ 10‑30 TB. Razlog je što od ona „tri V“ s početka priče, prvi posvećen količini podataka, polako ali sigurno ustupa primat dvema drugim dimenzijama – brzini i raznovrsnosti.

Granicu u količini podataka je uvela Big Data, preciznije rečeno njene sofisticirane metode, tehnologije i softver, u svakodnevni život, naročito u sferi poslovnog odlučivanja i marketinga. Uz velike investicije u ovu tehnologiju, još uvek prilično veliki BI i MRM sistemi koji koriste Big Data mogu da se nađu samo u najvećim i tehnološki najnaprednijim kompanijama, ali čini se da se točak napretka toliko zavrteo da neće proći mnogo a da i mala i srednja preduzeća iz komšiluke ne osete koristi i neophodnost korišćenja ove tehnologije u svakodnevnom poslovanju.

Na to ukazuje prava poplava analiza, istraživanja i novinskih članaka koji prate dešavanja na polju poslovne analitike. Njihov broj se višestruko povećao od početka godine, a naročito u poslednja dva meseca. Kao da su svi čekali kraj leta kako bi „velike podatke“ uveli na velika vrata svetske pozornosti. Gary Evans iz EMC‑a je na skupu privrednika i informatičara u Irskoj posebno istakao da već sada, na određen način i u adekvatnom obliku, Big Data može da donese koristi malim i srednjim preduzećima. On kaže da se to pre svega odnosi na ogroman porast značaja socijalnih mreža i medija, odnosno njihov nesumljivi uticaj na tržište robe i usluga široke potrošnje. Tako su javno dostupni podaci na socijalnim mrežama postali u neku ruku zajednička poslovna informacija kojoj svi mogu da pristupe, a oni koji ih budu najpreciznije i na najširem uzorku analizirali imaće i najbolja poslovna predviđanja.

Ko je ko

I tako, hteli mi to ili ne, zapravo već sada „posedujemo“ velike količine podataka, a tu Big Data arhivu treba analizirati kako bismo osigurali ili uvećali zaradu. Evans, ipak, ne krije da Big Data nije za svakoga: „Mala, pa često ni srednja preduzeća nemaju jake timove analitičara koji znaju da dobro prepoznaju šta iz šume podataka treba iskopati kako bi se dobio kvalitetan rezultat. Zato, ako niste u stanju da dovoljno dobro definišete fokus analize, ulazak u svet velikih podataka može da bude veoma rizičan“, kaže ovaj stručnjak. Napomenućemo da u Irskoj važi sličan kriterijum razvrstavanja kao i kod nas: srednje preduzeće ima do 250 zaposlenih.

Trenutna ulaganja u istraživanja, tehnologije, razvoj sofvera i hardvera namenjenih analizama velikih podataka su među najvećim na IT tržištu. Primera radi, najveći Big Data „igrači“, dakle AG, IBM, Oracle, Microsoft, SAP, EMC, HP i Dell, su u poslednje vreme samo na kupovinu kompanija koje se bave razvojem Big Data softvera potrošili 15 milijardi dolara, a vrednost Big Data tržišta je premašila magičnih 100 milijardi dolara još na kraju 2010. godine. Trend uvećanja vrednosti ovog segmenta je 10% na godišnjem nivou, ili približno dvaput više nego za klasično softversko tržište, gledano u globalu.

Najistaknutiji korisnici Big Data tehnologija su danas kompanije koje se najčešće ističu u kontekstu velikog poslovnog uspeha čak i u doba globalne ekonomske krize. Na prvom mestu je eBay koji je od svojih 90 PB u skladištu podataka izvukao 7,5 PB da ga propusti kroz Big Data tehnologije. Sličnu količnu podataka u okviru Big Data analitike svakodnevno koristi Amazon, dok Walmart operiše sa trećinom te količine. Facebook je takođe upregao Big Data tehnologije, ali nema pouzdanih podataka koliko i gde se koristi, baš kao što je to slučaj i sa Google‑om.

Jesmo li spremni?

Vreme za nas i Big Data će tek doći, ali izgleda da još nismo potpuno spremni za njih. Ali, ne treba misliti da je to nešto što se dešava „tamo daleko“ – Big Data tehnologije su već na našem pragu. Evo sasvim jednostavnog podatka koji mnogo govori: 1500 prosečnih korisnika interneta, dakle onih koji nemaju običaj da preuzimaju velike količine podataka, već su posvećeni prikupljanju informacija, godišnje „obradi“ onih famoznih 10 TB donjeg praga za Big Data sa početka priče. A da o brzini protoka i raznovrsnosti ne govorimo.

Ako smo vas malo zaintrigirali za ovu temu, već sada možete da osetite čari i izazove Big Data sveta – dobra mesta za početak su Google Analytics i Google BigQuery.

U PC#204 analiziramo ponudu BI i Big Data rešenja koja na našem tržištu nude kompanije Adacta i QlikTech, GoPro, Microsoft, OSA Računarski Inženjering i SAS.