Gdje pohraniti sve podatke?

Big Data i Data Analytics: o čemu je riječ? 

Izrazi “Big Data” i “Data Analytics” postali su popularne riječi posljednjih godina. Ali mnogi koji koriste ove pojmove zapravo ne razumiju što oni znače, o kojim se mogućnostima i ograničenjima radi, ili kakvu stvarnu vrijednost sve te informacije mogu imati.

U ovom članku objasnit ćemo Vam što je Big Data. Također ćemo ćemo raspravljati o nekim od najčešćih zamki s kojima se tvrtke susreću u analizi podataka. I na kraju, raspravljat ćemo o tome kako najbolje strukturirati proces analize podataka kako bi se izbjegle takve zamke i kako bi se izvukao maksimum iz dostupnih resursa podataka.

Što je Big Data?

Prije nego što razgovaramo o najprikladnijim načinima provođenja “Data Analytics “, važno je razumjeti pravo značenje Big Data-a. Izraz Big Data bi mogao biti pogrešan, jer nas doslovni prijevod navodi da mislimo da se jednostavno odnosi na ogromnu količinu podataka koju danas imamo na raspolaganju. Ovo je, međutim, reduktivna definicija pojma.

Ako je istina da je količina dostupnih podataka danas nezamisliva, koncept na koji mislimo kada govorimo o Big Data ili revoluciji velikih podataka je sposobnost koja danas postoji za obradu, analizu i crtanje objektivnih aplikacija iz svih tih podataka, što sugerira dosad nezamislive obrasce i modele interpretacije..

Ovu mogućnost daju algoritmi sposobni za obradu ogromne količine podataka u kratkom vremenu i s malo računalnih resursa.

Informacije koje bi se danas, algoritmom i jednostavnim prijenosnim računalom mogle obraditi u roku od nekoliko sati, do nedavno bi zahtijevale puno vremena i skupa računala.

To je Big Data revolucija.

Big Data primjeri

Revolucija Big Data-a odavno je ušla u naše živote, iako je ne primjećujemo posebno. Uzmimo nekoliko praktičnih primjera.

Upotreba velikih podataka u marketingu nalazi se u takozvanim metodama preporuka, poput onih koje Netflix ili Amazon koriste za ponude za prilaz ili kupnju usmjerene na određenog korisnika. To se može odraditi sa znanstvenom preciznošću, jer svi navigacijski podaci korisnika, od kupnje, proizvoda koji se traže ili ocjenjuju, omogućuju sugeriranje najprikladnijih proizvoda i usluga za tu osobu, onih koji će zasigurno privući njegovu pažnju. I tako algoritmi uspijevaju “saznati” čak i ako je žena trudna, na temelju svojih istraživanja i ponuditi joj ponude i proizvode koji joj mogu poslužiti.

Big Data vam omogućava pronalazak neobične asocijacije: prema nekim istraživanjima istraživanja data mining-a, kupci namještaja osjećali su veću sklonost podmirivanju svojih dugova u utvrđenim vremenima, što predstavlja idealne klijente za kreditne institucije.

U svakodnevnom životu pronalazimo mnoge druge aplikacije za Big Data.
Na primjer – o raspoređivanju policijskih snaga na mjesta i vremena u kojima se zločini najvjerojatnije događaju.
Ili na proučavanje povezanosti između kvalitete zraka i zdravlja.

Da biste shvatili opseg moći Big Data-a, samo razmislite da je Google još 2008. godine uspio predvidjeti prisutnost epidemije gripe na teritorijama Sjedinjenih Država brže nego što je to Ministarstvo zdravstva uspjelo učiniti nadgledanjem evidencije bolničkog prijema javnih i privatnih zdravstvenih ustanova.

Uloga statistike

Merriam-Webster definira statistiku kao “granu matematike koja se bavi prikupljanjem, analizom, interpretacijom i prezentacijom mase brojčanih podataka.” Statistika je bitna u analizi podataka.

Karakteristike podataka

Karakteristike podataka će odrediti mogu li se i kako određeni podaci koristiti u projektu analize podataka. NIST (Nacionalni institut za standarde i tehnologiju) navodi četiri glavne karakteristike koje podaci moraju imati – volumen, brzinu, raznolikost i varijabilnost – kojima Cary, tvrtka za analizu podataka sa sjedištem u Sjevernoj Karolini, dodaje petu karakteristiku, naime instinitost.

VOLUMEN: odnosi se na broj točaka podataka. Pristup naizgled beskonačnim točkama podataka može značiti mogućnost identificiranja karakteristika potrošača i ponašanja s nevjerojatnim stupnjem točnosti, ali troškovi arhitekture za obradu takvih podataka rastu s volumenom.

BRZINA: strogo povezana s volumenom, ova značajka uzima u obzir brzinu kojom se podaci mogu ili mogu prikupljati.

RAZNOLIKOST: podaci su dostupni u različitim oblicima. Na primjer, preferencije potrošača mogu se mjeriti pregledom potrošačkih anketa, nadgledanjem internetskih pretraga ili nadgledanjem odluka o kupnji.

VARIJABILNOST: promjenjivost se odnosi na promjene podataka tijekom vremena. Te promjene mogu uključivati brzinu kojom podaci teku, format podataka ili same podatke.

ISTINITOST: podaci iz različitih izvora mogu biti više ili manje pouzdani. Na primjer, potrošači mogu prijaviti postavke koje ne odgovaraju njihovom stvarnom ponašanju o kupnji. Podaci o prodaji iz nekih izvora mogu biti dvosmisleni ili čak namjerno netočni. Istinitost se odnosi na kvalitetu podataka.

Što je analiza podataka (Data Analytics)?

Analiza podataka doslovno znači analiziranje dostupnih podataka. Može imati različite oblike, ovisno o namjeri analize:

  • Opisna što se dogodilo?
  • Dijagnostika zašto se to dogodilo?
  • Predviđanje što će se dogoditi?
  • Preskriptivna što treba učiniti?

Složenost analize proporcionalno raste od deskriptivne do preskriptivne. Pitanje za deskriptivnu analizu podataka moglo bi biti: “Koliko novaca prosječni hrvatski potrošač godišnje potroši na održavanje automobila?”
Odgovor se može dobiti relativno lako analizirajući dovoljnu količinu podataka o navikama potrošnje, a taj je odgovor koristan ako pomaže u određivanju veličine dostupnog tržišta.

Povezano dijagnostičko pitanje moglo bi biti: “Zašto potrošači troše ovoliku količinu novca na održavanje automobila? Zašto ne troše više ili manje?” To zahtijeva pomnije promatranje podataka i uspostavljanje nekih veza, kao što su potrošačke navike pojedinaca pripadnost određenim demografskim skupinama, dohodovnim razredima ili zemljopisnim regijama; navike potrošnje za određene vrste održavanja automobila ili obim potrošnje kod određenih tvrtki u odnosu na druge.

Predviđeno praćenje bi bilo: “Koje potrošačke navike će imati hrvatski potrošači za održavanje automobila u sljedećih 5 godina?”

Konačno, preskriptivno pitanje: “S obzirom na ono što vjerujemo da je sadašnje i buduće stanje tržišta, što bismo trebali učiniti?”

U našoj hipotetičkoj analizi tvrtka iz sektora automobilskog održavanja koja se suočava s ovim pitanjem može odlučiti uložiti više ulaganja u određeno područje sektora, usmjeriti se izravno na određene tržišne segmente, usporediti i slijediti najbolje prakse specifičnih konkurenata ili čak potpuno napuštanje sektora.

Da li je uvijek potrebna analiza Big Data?

Ono što razlikuje velike podatke (Big Data) od uobičajenog uzorka podataka je veličina i složenost upravljanja svim tim podacima. Veliki podaci, po definiciji, sastoje se od ogromnih količina podataka koji zahtijevaju ogromnu procesorsku snagu da bi se učinkovito koristili.

Treba li tvrtka provoditi analizu velikih podataka? Ovisi o analizi. Statistika postaje točnija kako se veličina skupa podataka povećava. A točno odgovaranje na složena pitanja postaje lakše jer je točnost temeljnih statističkih zaključaka točnija.

Stoga tvrtka koja treba analizirati stopu kvarova u procesu proizvodnje madraca u posljednje tri godine vjerojatno neće morati koristiti velike podatke (Big Data). Međutim, ako ista tvrtka želi provesti preskriptivnu analizu u vezi s poslovnim planom za ulazak na tržište vrhunskih madraca jugoistočne Azije unutar petogodišnjeg razdoblja, možda će trebati velike količine podataka kako bi osigurala da su njezine procjene i predviđanja dovoljno točne kako bi se opravdao poslovni plan.

Česte zamke u analizi podataka

Tvrtke koje žele iskoristiti prednosti analitike podataka moraju biti svjesne brojnih potencijalnih zamki, imajući na umu da bi tvrtka mogla potrošiti ogromne količine vremena, novca i drugih resursa na projekt analize podataka s malo ili bez koristi. Ili, još gore, na kraju donijeti ishitrenu odluku. Evo nekoliko pogrešaka na koje treba pripaziti.

Nema jasnog cilja: neke tvrtke mogu pomisliti: “Ako uspijemo dobiti podatke, odgovor će se činiti jasnim.” Prikupljanje podataka iz milijardi točaka podataka i njihovo usmjeravanje u crnu kutiju koja izbacuje vrijedne informacije nije baš pravi način za korištenje analitike podataka. Tvrtke koje se odluče za analizu podataka bez jasnog cilja riskiraju trošenje značajnih resursa bez postizanja ikakvog pozitivnog učinka.

Previše pretenciozni ciljevi: imati preambiciozan cilj isto može biti zamka Tvrtke moraju razmotriti vlastite resurse i sposobnosti prije definiranja svojih ciljeva analize podataka. Tvrtka s proračunom od 5000 dolara i jednim zaposlenikom s punim radnim vremenom koji vodi projekt analize podataka ne može realno očekivati ​​da će predvidjeti trendove preferencija potrošača u Sjedinjenim Državama za narednu godinu. Ali možda će moći identificirati najproduktivnije i najmanje produktivne radne sate na jednoj od svojih proizvodnih linija.

Temeljne odluke o netočnim podacima: kao što je gore spomenuto, krajnji cilj analize podataka je odrediti ispravan tijek radnje, s obzirom na trenutno i očekivano stanje stvari. Ako se odluke o ispravnom postupanju temelje na pogrešnoj procjeni sadašnje i buduće situacije, takve bi se odluke mogle pokazati katastrofalnim. To je razlog zašto preskriptivna analitika zahtijeva odgovarajuće ulaganje u resurse potrebne kako bi se osigurala točna deskriptivna, dijagnostička i prediktivna analitika.

Strukturiranje učinkovitog projekta analize podataka

Svjesni onoga što može poći po zlu, razmislimo sada o ključnim koracima za strukturiranje učinkovitog projekta Analize podataka.

Postavite jasne ciljeve. Tvrtke koje žele iskoristiti analitiku podataka moraju imati jasne ciljeve. Bez obzira na to je li analiza deskriptivna, dijagnostička, prediktivna ili preskriptivna.

Formulirajte jasna pitanja. Bilo da se radi o procjeni trenutnog stanja na tržištu ili o određivanju gdje pozicionirati tvrtku tijekom sljedeće godine, važno je razviti jasna osnovna pitanja. Na primjer, da bi znale zašto potrošači preferiraju određenu marku madraca, tvrtke moraju prvo otkriti koje marke preferiraju, koje su karakteristike tih marki, koje kvalitete potrošači cijene u odnosu na druge itd.

Razviti strategiju za odgovor na ova pitanja. Kako odgovoriti na pitanje o preferencijama potrošača? Strategija bi mogla uključivati ​​provođenje anketa, analizu podataka online istraživanja i odluka o kupnji, razgovore sa stručnjacima za potrošače ili kombinaciju ovih i drugih strategija.

Prikupiti podatke. Faza prikupljanja podataka u biti je provedba strategija identificiranih u prethodnoj fazi: provođenje anketa, prikupljanje podataka o kupnji ili online pretraživanjima itd.

Analizirati. Ovisno o vrsti provedene analize podataka, ovo može biti iznimno složen korak. Ako je analiza jednostavno deskriptivna, može biti jednostavna kao brojanje ili usrednjavanje. Sve složenije što uključuje donošenje zaključaka o korelacijama u podacima i budućim predviđanjima očito je puno kompliciranije.

Ponavljanje. Kao što je slučaj s mnogim tvrtkama, malo je vjerojatno da će se na prvi pogled primijetiti točna analiza podataka. Izvori podataka možda nemaju dovoljnu istinitost ili volumen, zaključci se mogu temeljiti na netočnim vezama podataka itd. No ponavljajući postupak, učeći na greškama i uvodeći potrebne promjene, tvrtke mogu vremenom steći značajnu stručnost u vezi s analizom podataka.

Tvrtke imaju na raspolaganju različite resurse koje koriste za ostvarivanje profita. Ti resursi mogu uključivati materijalnu imovinu kao što su zaposlenici, sirovine, zgrade i oprema. Ali oni uključuju i nematerijalnu imovinu poput intelektualnog vlasništva i podataka. Podaci su dragocjena imovina i mnoge tvrtke to tek počinju shvaćati.

Veliki podaci (Big Data) i analitika podataka mogli bi zvučati kao složeni koncepti, samo u dosegu tehnološki najnaprednijih tvrtki, ali u stvarnosti su složeni samo u onoj mjeri u kojoj ih odlučite koristiti. Ako razumijete ove koncepte, moguće je precizno i ​​usko definirati cilj analize podataka i dobiti smislene i učinkovite rezultate.

Ključno je ne pretjerati s ogromnom količinom podataka, ne biti pretjerano ambiciozan s obzirom na nečije stvarne mogućnosti i jasno definirati plan projekta analize podataka.

Izvoriwww.bedtimesmagazine.comwww.cloudtalk.it

Share on Social Media

Saznajte što Fluentis ERP može učiniti
za vaše poslovanje

Besplatno probno razdoblje | Bez automatske obnove | Trenutni pristup

Infografica 2

Kontaktirajte nas za više informacija