2016: Věk datové analytiky

Autor: Jan Matoušek, 3. února 2016

Data se valí ze všech směrů a jsou považována za novou měnu, kterou se platí v digitálním světě. Ve státním i obchodním sektoru data přibývají exponenciální rychlostí. Kromě toho roste i jejich komplexita a různorodost.

Těsně v závěsu jsme my, datoví analytici, kteří z dat těžíme použitelné informace. Jsme vlastně v podobné situaci, jako policista, který se poučí až z chyceného zloděje, ačkoli ten další bude mít nové metody. Business ovšem potřebuje celý proces získávání a používání dat zrychlit do té míry, aby podchytil i nově příchozího zákazníka, okamžitě ho ohodnotil a přinesl mu ihned relevantní nabídku. Marketing rychlé reakce ovšem není jedinou aplikací ve sféře velkých dat. I státní správa se přesouvá do oblasti „rychlé reakce“ a potřebuje například odhalovat hledané osoby z kamerového záznamu automaticky, rychle a velice přesně. 

Například v minulém roce vyhlášený program FBI s názvem NGI dokáže snadno a rychle identifikovat konkrétní osoby pouze při zachycení tváří z veřejného kamerového systému. Na základě několika detailů fotek zpracovaných data miningovým algoritmem je pachatel záhy identifikován. Již brzy se připojí do systému i identifikace očí, sítnic či hlasu, typ chůze nebo délka kroku osob. A Tom Cruise je zpět se svým starším „Minority Report“ v praxi v roce 2015! Ne zcela! Na to si chvilku počkáme, ale tzv. Next Generation identifikační systém od FBI se stal plně funkční jedno hezké pondělí v roce 2014. Od té doby Americká vláda očekává, že databáze systému zpracovala a uložila v průběhu dvanácti měsíců více než 51 milionů fotografií - a jejich počet aktuálně roste. Propracovanému data miningovému systému postavenému na superpočítači vyrobenému z lidských dvojčat, který měl filmový Tom Cruise k dispozici, NGI zatím konkurovat pravděpodobně nedokáže, ale věřme, že se blížíme směrem k cíli! Big data a data mining jsou všude kolem nás, to je jistá realita! 

Big data a velká slova 
Ve vzduchu je cítit velká změna. Marketingový pojem „velkých dat“ se jednoznačně připojil k technologické bublině 2.0. Pejorativní označení „bublina“ může být trochu nadnesené a rozhodně neznamená katastrofu pro každého. Tato bublina, stejně jako technologická bublina roku 2000, či nadšení pro železnice na přelomu minulých století, přinese kromě rizika pro investory i obrovský rozvoj technologií, které by jinak nevznikly anebo by se rozvíjely daleko pomaleji. Ve vzduchu je cítit odhodlání a peníze na to „s těmi daty konečně něco dělat“. A to je velmi pozitivní, alespoň pro tu část trhu, která se bude chovat racionálně.  Jako rozumné chování si označme vytěžování dat, počínaje reportingem po data mining. Cíl zvýšit organizaci zisk, vylepšit efektivitu či snížit rizika je zcela pochopitelný. Na druhé straně pomyslné škály racionality je příliv peněz do snadno kopírovatelných start-upů či nahraditelných online služeb, které technologickou bublinu 2.0 provází.  

Kravaty a hippies  - sekery zakopány! 
Žádná datová analytika se neobejde bez kvalitního software. Programové kódy jsou tak jednoznačným předpokladem k tomu s daty skutečně pracovat, a ne jen meditovat nad jejich množstvím. Přesto historicky vznikly dva zdánlivě nesmiřitelné proudy vývoje software. Na jedné straně zde byla skupina nadšenců píšících kód po večerech bez nároku na honorář. Open source komunita se svou nesmiřitelností podobala hippies, punkerům či jiným hnutím, a chápala své poslání jako náboženství. Na straně druhé stály korporace, které prosazovaly mnohdy nesmyslně uzavřené řešení.
Tenhle stav je naštěstí minulostí. Hranice mezi oběma světy se setřely. Na jedné straně open source komunita začala váhavě oceňovat profesionální práci komerčních vývojářů. Na straně druhé jsou tu otevřené náruče korporací, které pochopily, že mohou otevřený software prostě integrovat do svých robustních řešení, a nepřímo vydělat i na něčem, co dostaly zadarmo. Základy pro koexistenci světů jsou tedy položeny, a diskuse již nemá tolik ideologickou rovinu. Pro konzumenty datových řešení to je dobrá zpráva. Ani jeden směr vývoje se neztratí, a lidé mají na výběr mezi vyladěným komerčním softwarem anebo časovou investicí do open source. Svobodný software zde bude pro experimentátory a technické nadšence, zatímco pro přátele efektivity a nejkratších cest zůstanou jasnou volbou komerční řešení.  
V posledních letech vidíme i ze strany velkých softwarových gigantů, jako je Microsoft nebo IBM upřímnou snahu směrem k otvírání platforem a získávání zákazníků, kteří nahlédli do obou světů. Microsoft začal podporovat Linuxové distribuce na svých Azure serverech, IBM zase integruje neznámější otevřený analytický systém „R“ do svých produktových řad pro analytiky „SPSS“ a „Neteeza“. 


Co bude až nebudou Big data a Cloud? 

Velká slova či buzz-wordy typu „Big data“ a „Cloud“ mají krátký dech a do 10-ti let od svého vzniku se rozplynou. Tou dobou bychom tu měli mít spolehlivé a levné služby pro reporting, analytiku a skoring zákazníků. Nikdo se ovšem již nebude chlubit tím, kolik terabajtů surových dat skladuje, jak velké má servery, či zda jsou uloženy ve Spojených státech. Datová skladiště totiž stojí na špatné straně finančních rozvah, a to na straně nákladů. Důvodem ke spokojenosti bude, pokud se většina organizací dostane ke skutečnému využití dat pro péči a rozvoj zákazníků, k redukci bezpečnostních rizik či daňových úniků.  

Efektivita nebo soukromí 

Z celkem okrajové oblasti využití dat se do konce desetiletí stane centrální téma pro firmy i občany.  Volba mezi efektivitou a soukromím se postupně zviditelňuje a dostává konkrétní obrysy.
Spolu s tím, jak se bude zvyšovat tlak korporací a státu na využití dat, se i spotřebitel či občan začne vehementněji ptát, jaká vlastně data se o něm sbírají a na co se využívají. Poměrně napřed je v tomto trendu Evropská komise, která bedlivě sleduje aktivity velkých online hráčů, a vymezuje jim hřiště. Sladká naivita, kdy aplikace pro Android získá mnoho dat výměnou za nějakou okrajovou funkcionalitu, brzy skončí. I spotřebitel bude za svá data požadovat skutečně nadstandardní funkcionalitu, a hlavně se ujistí, že data budou pracovat v jeho prospěch. Nebude již zkrátka možné data jednostranně vysávat a nic za ně nenabídnout.
Do zajímavého experimentu se v tomto směru pouští Microsoft, který ve Windows 10 požaduje od uživatelů velké množství dat. Otázkou je, zda výhody moderního operačního systému převáží nad kompromisy v soukromí, a zda uživatelé budou tento výměnný obchod akceptovat, nebo se pustí do ochrany svého soukromí, a sdílení dat si jednoduše vypnou. Odpověď bychom měli dostat právě v roce 2016.
Data pro korporace budou i nadále znamenat především cílení nabídek podle profilu uživatelů. Oblast cílených nabídek není zdaleka vyčerpána a zanedlouho již převáží nad přebujelým elektronickým spamem.
Tento směr potvrzuje i nadzvukovou rychlostí rostoucí trh s tzv. „real time bidding“, v oblasti cílené digitální reklamy. Růsty tržeb např. Adform za posledních 12 měsíců jsou obdivuhodné, navíc potvrzují správnost využití získaných dat o spotřebiteli a další potenciál!
Ruku v ruce s podílem vyhledávání a provedených transakcí pomocí mobilních zařízení se bude tento typ reklamního cílení směrem k zákazníkovi více zpřesňovat.
Spolu s tím, jak se bude zrychlovat reakce nabídky na aktivitu uživatele, ovšem někteří lidé znervózní a bude se rozvíjet trh se soukromými, nesledovanými nástroji. První vlaštovky chránící spotřebitele jsou již na světě, jmenujme třeba projekt „Tor“ pro anonymní brouzdání po internetu. Zatímco v online prostředí si člověk může zajistit alespoň trochu anonymity, v jiných odvětvích je jeho soukromí v rukou businessu a regulátorů. Telekomunikační, energetická a bankovní data lze v praxi velmi těžko „smazat“ a spotřebitel se o ně dělí s operátorem víceméně nedobrovolně. Zvyšování tlaku bude následovat na obou stranách. Majitelé dat se budou snažit svá data zpeněžovat pomocí relevantní reklamy a regulátoři budou bojovat za ochranu soukromí. Pochopitelně, jako v minulosti, nedojde k žádnému definitivnímu vítězství či porážce ani na jedné ze stran, a přetahovaná nebude mít konce.

 

Jan Matoušek a Marek Čerňanský, Data Mind s.r.o.

Původně pro časopis Connect! (Příloha časopisů Computer a Euro)

Tyto webové stránky používají k poskytování svých služeb soubory Cookies. Používáním těchto webových stránek souhlasíte s použitím souborů Cookies.
Nastavení Souhlasím
Souhlas můžete odmítnout zde.
×
Nastavení cookies

Zde máte možnost přizpůsobit soubory cookies dle kategorií, jak vyhovují nejlépe Vašim preferencím.

Technické cookies

Technické cookies jsou nezbytné pro správné fungování webové stránky a všech funkcí, které nabízí a nemohou být vypnuty bez zablokování funkcí stránky. Jsou odpovědné mj. za uchovávání produktů v košíku, přihlášení k zákaznickému účtu, fungování filtrů, nákupní proces nebo ukládání nastavení soukromí. Z tohoto důvodu technické cookies nemohou být individuálně deaktivovány nebo aktivovány a jsou aktivní vždy

Analytické cookies

Analytické cookies nám umožňují měření výkonu našeho webu a našich reklamních kampaní. Jejich pomocí určujeme počet návštěv a zdroje návštěv našich internetových stránek. Data získaná pomocí těchto cookies zpracováváme anonymně a souhrnně, bez použití identifikátorů, které ukazují na konkrétní uživatelé našeho webu. Díky těmto cookies můžeme optimalizovat výkon a funkčnost našich stránek.

Preferenční cookies

Preferenční cookies umožňují, aby si webová stránka zapamatovala informace, které mění, jak se webová stránka chová nebo jak vypadá. Je to například Vámi preferovaný jazyk, měna, oblíbené nebo naposledy prohlížené produkty apod. Díky těmto cookies Vám můžeme doporučit na webu produkty a nabídky, které budou pro Vás co nejzajímavější.

Marketingové cookies

Marketingové cookies používáme my nebo naši partneři, abychom Vám dokázali zobrazit co nejrelevantnější obsah nebo reklamy jak na našich stránkách, tak na stránkách třetích subjektů. To je možné díky vytváření tzv. pseudonymizovaného profilu dle Vašich zájmů. Ale nebojte, tímto profilováním zpravidla není možná bezprostřední identifikace Vaší osoby, protože jsou používány pouze pseudonymizované údaje. Pokud nevyjádříte souhlas s těmito cookies, neuvidíte v reklamních sděleních obsah ušitý na míru Vašim zájmům.

DALŠÍ ČLÁNKY