Co jsou big data a k čemu jsou dobrá?

S pojmem big data jste už jistě setkali. Co ale tento pojem vlastně znamená? A jak big data fungují? V překladu jde o tzv. „veledata“, tedy data, která jsou tak velká, že je není možné spravovat, zachycovat ani zpracovávat běžně dostupnými softwarovými prostředky, chceme-li s nimi pracovat v rozumném čase. Slouží k různým analýzám nebo mohou pomoci firemnímu marketingu.

Jistě jste již slyšeli dnes velmi často používaný pojem v ICT – big data. Co ale vlastně tento pojem znamená? K čemu jsou big data dobrá? Jsou budoucností marketingových strategií právě big data?

Co jsou big data?

Big data je možné přeložit jako velká data nebo veledata. Jedná se o data, která jsou tak velká, že je není možné zachycovat, spravovat ani zpracovávat pomocí běžně dostupných softwarů tak, abychom s nimi mohli pracovat v rozumném čase. Je to tedy masivní objem nestrukturovaných dat. Aby big data společnostem pomohla, musí je ale umět vyhodnotit. Big data jsou šancí téměř pro všechny tržní sektory. Profitovat z nich mohou například společnosti, které působí na finančních trzích, maloobchod, energetické či telekomunikační firmy. Pomohou nejen získat více informací o zákaznících, ale i vytvořit nové výnosobé toky. Mohou zefektivnit poskytování produktů a služeb, zlepšit komunikaci se zákazníky a pomoci k lepšímu marketingu.

Big data dnes využívá mnoho společností. Příkladem může být například Airbank. Sestavený prediktivní model zde pracuje s více než 200 atributy a na denní bázi dodává afinitní zákazníky k oslovení. Model funguje na základě aktuálních dat (primární transakční data, průměry výdajů za několik měsíců, výkyvy v chování zákazníka, výkyvy v obvyklé výši zůstatku během roku, změny zaměstnání apod.), proto vystihne správný okamžik k oslovení zákazníka. Dále big data využívá například Rohlik.cz (logistika skladu), Formica (analýza výkonnosti a vytíženosti callcentra), Kofola, KPMG a mnoho dalších.

Klíčová je analýza velkých dat

Objem velkých dat neustále roste. Příležitostí pro firmy jsou zejména pokročilé analýzy velkých dat, která dříve nebylo možné efektivně zpracováva narozdíl od dnešní doby, kdy je to umožněno díky rychlejším počítačům, novým softwarům a levnějším úložištím. . Analýza velkých dat je cestou k detailnímu poznání zákazníků,(potřeby, návyky, atd.) Díky správné analýze budou moci firmy poskytovat služby šité na míru,  snižovat náklady a zvyšovat efektivitu.

Řešení pro big data zasahuje do spousty IT komponent. Je nutné mít například k dispozici úložiště, servery a sítě (poskytují například HP nebo IBM). V dnešní době se velice rychle rozšiřuje množství dodavatelů řešení big data. Mnoho z nich má své vlastní nástroje pro distribuci (např. Hadoop). Pro obsluhu požadavků, čtení i zápis velkoobjemových dat  jsou využívány zejména noSQL databáze. Výstupem řešení velkých dat jsou analýzy a vizualizace. Dodavateli zde jsou například IBM, SAS nebo Oracle.

Jak fungují big data?

Od doby, kdy jsme začali používat internet, máme k dispozici nepřeberné množství dat.  Big data tvoří každý z nás… například tím, že provedeme nákup na eshopu nebo účastí na sociálních sítích. Big data obsahují digitalizované dokumenty, videa, fotografie, zvukové soubory, tweety, různé příspěvky, emaily, textové zprávy, telefonní záznamy, záznamy z finančních transakcí a další. Pokaždé, když uděláte něco online, zanecháváte tedy digitální stopu. Tato obrovská množství dat vyžadují nové metody pro sběr, ukládání, zpracování i vyhodnocování.

ID-100172682

Jak se pracuje s velkými objemy dat?

Pojem „velikost“ dat je chápán nejen z hlediska objemu dat měřeného giga- nebo terabyty, ale i z hlediska rychlosti jejich tvorby a přenosu a z hlediska různorodosti jejich typů formátů. Objem digitálních dokumentů, emailů a dalších souborů neustále stoupá. Pomocí ETL nástrojů jsou v současné době tato data přenášena do oblastí, kde je kontrolována jejich kvalita a provádí se jejich normalizace. Finálně jsou data ukládána do datových skladů.

Velká data musí být shromažďována, vzájemně propojena a správně interpretována, aby z nich mohl být nějaký užitek. Společnosti potřebují filtrovat velké množství údajů, které pro ně budou relevantní. Naštěstí HW a SW pro zpracování těchto dat jsou dnes již dostupnější a levnější. Některé softwary jsou dnes už uživatelsky velice přívětivé a není proto nutné mít ve společnosti programátory a vědce, aby bylo možné vytěžit data relevantní pro konkrétní firmu.

9990024683_a37089e13d_z

Společnosti také čím dál tím více využívají služeb cloud computingu, takže si ani nepotřebují kupovat speciální zařízení. Tyto velké objemy dat jsou obvykle ukládány v tzv. datových skladech. Jsou zde ukládána data z různých zdrojů a informačních systémů pomocí ETL procedur.

Příklady přehledně zpracovaných velkých dat

Disease-network

zdroj: ge.com

infographics

zdroj: bigdatasightgroup

Nástroje pro big data

Snad nejznámějším nástrojem pro big data je Hadoop, což je open source software, který ale může pro některé uživatele představovat problém. Společnosti zabývající se big daty tedy tento SW často používají jako základ, na kterém staví vlastní řešení.

Nástroje pro analýzu velkých dat

SVAT

SVAT (Smart Visual Analytics Tool) je nástroj pro analýzu fraud nebezpečí (tedy podvodů – např. týkajících se finančních transakcí).  Tento nástroj používají například kriminalisté ke zjištění, zda dva podezřelí mohli být spolu v době spáchání činu, a to například na základě trackování mobilních telefonů.

Výstřižek

Manta

Manta je nástroj společnosti Profinit sloužící k analýze datových skladů (prakticky také big data). Systém hodnotí data a vyhodnocuje, zda je možná optimalizace datového skladu a tím snížení nákladů na jeho provoz.

Nástroje pro automatizaci velkých dat

Sales Booster

Sales Booster je Data Management platformou společnosti Profinit, která integruje interní data, data partnerů a třetích stran a je cestou k marketingu orientovanému na zákazníka. Příliš mnoho společností se dnes ještě stále rozhoduje na základě subjektivního úsudku, budoucnost se však skrývá v datech, která umožní poznání zákazníka. datech. Finanční situace klienta se odráží ve struktuře jeho majetku a cashflow. Jeho finanční chování lze odvodit z používání finančních produktů a služeb, životní styl a sociální vazby jsou zachyceny v transakcích, očekávané životní události jsou pak identifikovány kombinací osobních, transakčních a kontaktních dat. Tento profil klienta je základem customer-centric marketingu.

2015-11-09_220052

Sales Booster integruje interní data, data partnerů i třetích stran včetně veřejných

I takto jsou tedy využívána big data. Pokud si klient na internetu prohlíží možnosti spotřebitelského úvěru a následně mu přijde nabídka od jeho banky, pravděpodobně je součástí kampaně jako je výše zmíněná.

Nástroje pro vizualizaci velkých dat

Tableau

Tableau je systém, díky kterému je možné okamžitě analyzovat firemní data a vytvořit jejich detailní a přehledné zobrazení. Slouží také k rychlému a snadnému reportingu.Tableau server například umožňuje sdílet a řídit přístup k dashboardům, které vytvořili jiní uživatelé. Tableau desktop je pak určen komukoliv, kdo z těchto dat potřebuje vytvářet reporty, workbooky nebo dashboardy.

big data

ukázka dashboardu týkajícího se zákazníků

Tangle

Tangle je v podstatě knihovna založená na JavaScriptu, která vytváří vizualizace tak, aby vývojáři a designéři mohli vytvářet reaktivní programy, které budou poskytovat hlubší porozumění datovým vztahům. Je možné vytvářet tabulky, grafy a další vizualizace. Nástroj je k dispozici zdarma.

Výstřižek

Data Driven Documents

Data Driven Documents je JavaScript knihovna pro vytváření vizualizací s důrazem na webové standardy. Pomocí HTML, SVG a CSS oživí vaše dokumenty. I tento nástroj je k dispozici zdarma.

Výstřižeky

Výstřižekiii

Výstřižek X

SAS Visual Analytics

SAS Visual Analytics je nástroj pro zkoumání dat všech velikostí a vytváření vizualizací. Díky velmi intuitivní platformě tohoto nástroje a nástrojům pro prognózování je i netechnickým uživatelům umožněno zkoumat hlubší vztahy dat mezi sebou a odhalit skryté příležitosti.

Výstřižekk

 

Využití big data

Big data jsou také využívána k personalizaci v rámci webů. Je vyhodnocováno, které stránky uživatel navštívil, co nakoupil, které produkty hledal a jak se na webech choval. Dle těchto informací jsou mu pak nabízeny relevantní produkty. Například pokud jsme si koupili parfém na parmums.cz, reklama by nám neměla být zobrazována i těsně poté, co jsme si jej zakoupili. Ale po nějaké době, kdy bychom ho už mohli mít spotřebovaný, by nám reklama opět mohla být zobrazována. Tato data jsou tedy využívána v remarketingu. Dále tento systém využívá například Alza.cz. nebo rohlik.cz. Velmi často je personalizace využívána například i při nákupech krmiva pro zvířata, opakovaně nakupované příslušenství atd.

Zejména v oblasti marketingu jsou big data velice důležitá. Samozřejmě, mít k dispozici velký objem dat nutně nevede k lepšímu marketingu, ale potenciál zde rozhodně je. Kombinace big data s integrovanou marketingovou strategií může mít značný dopad na vztahy se zákazníky (big data mohou přinést informace o tom, kdo jsou vaši zákazníci, ale i kde se nacházejí), udržení věrnosti zákazníků (big data vám například pomohou zjistit, proč se vaši zákazníci vrací do vašeho eshopu) a optimalizaci marketingu (skrz big data je možné určit optimální marketingové výdaje přes více kanálů a průběžně optimalizovat marketingové programy pomocí testování, měření a analýz).

Zdroj/foto: sas, computer.howstuffworks, tutorialspoint, freedigitalphotos,profinit, Shopcamp – přednáška Jan Kvasnička, systemonline

Komentáře

Nahoru