English

2016: Věk datové analytiky

Autor: Jan Matoušek, středa, 3. únor 2016

Data se valí ze všech směrů a jsou považována za novou měnu, kterou se platí v digitálním světě. Ve státním i obchodním sektoru data přibývají exponenciální rychlostí. Kromě toho roste i jejich komplexita a různorodost.

Těsně v závěsu jsme my, datoví analytici, kteří z dat těžíme použitelné informace. Jsme vlastně v podobné situaci, jako policista, který se poučí až z chyceného zloděje, ačkoli ten další bude mít nové metody. Business ovšem potřebuje celý proces získávání a používání dat zrychlit do té míry, aby podchytil i nově příchozího zákazníka, okamžitě ho ohodnotil a přinesl mu ihned relevantní nabídku. Marketing rychlé reakce ovšem není jedinou aplikací ve sféře velkých dat. I státní správa se přesouvá do oblasti „rychlé reakce“ a potřebuje například odhalovat hledané osoby z kamerového záznamu automaticky, rychle a velice přesně. 

Například v minulém roce vyhlášený program FBI s názvem NGI dokáže snadno a rychle identifikovat konkrétní osoby pouze při zachycení tváří z veřejného kamerového systému. Na základě několika detailů fotek zpracovaných data miningovým algoritmem je pachatel záhy identifikován. Již brzy se připojí do systému i identifikace očí, sítnic či hlasu, typ chůze nebo délka kroku osob. A Tom Cruise je zpět se svým starším „Minority Report“ v praxi v roce 2015! Ne zcela! Na to si chvilku počkáme, ale tzv. Next Generation identifikační systém od FBI se stal plně funkční jedno hezké pondělí v roce 2014. Od té doby Americká vláda očekává, že databáze systému zpracovala a uložila v průběhu dvanácti měsíců více než 51 milionů fotografií - a jejich počet aktuálně roste. Propracovanému data miningovému systému postavenému na superpočítači vyrobenému z lidských dvojčat, který měl filmový Tom Cruise k dispozici, NGI zatím konkurovat pravděpodobně nedokáže, ale věřme, že se blížíme směrem k cíli! Big data a data mining jsou všude kolem nás, to je jistá realita! 

Big data a velká slova 
Ve vzduchu je cítit velká změna. Marketingový pojem „velkých dat“ se jednoznačně připojil k technologické bublině 2.0. Pejorativní označení „bublina“ může být trochu nadnesené a rozhodně neznamená katastrofu pro každého. Tato bublina, stejně jako technologická bublina roku 2000, či nadšení pro železnice na přelomu minulých století, přinese kromě rizika pro investory i obrovský rozvoj technologií, které by jinak nevznikly anebo by se rozvíjely daleko pomaleji. Ve vzduchu je cítit odhodlání a peníze na to „s těmi daty konečně něco dělat“. A to je velmi pozitivní, alespoň pro tu část trhu, která se bude chovat racionálně.  Jako rozumné chování si označme vytěžování dat, počínaje reportingem po data mining. Cíl zvýšit organizaci zisk, vylepšit efektivitu či snížit rizika je zcela pochopitelný. Na druhé straně pomyslné škály racionality je příliv peněz do snadno kopírovatelných start-upů či nahraditelných online služeb, které technologickou bublinu 2.0 provází.  

Kravaty a hippies  - sekery zakopány! 
Žádná datová analytika se neobejde bez kvalitního software. Programové kódy jsou tak jednoznačným předpokladem k tomu s daty skutečně pracovat, a ne jen meditovat nad jejich množstvím. Přesto historicky vznikly dva zdánlivě nesmiřitelné proudy vývoje software. Na jedné straně zde byla skupina nadšenců píšících kód po večerech bez nároku na honorář. Open source komunita se svou nesmiřitelností podobala hippies, punkerům či jiným hnutím, a chápala své poslání jako náboženství. Na straně druhé stály korporace, které prosazovaly mnohdy nesmyslně uzavřené řešení.
Tenhle stav je naštěstí minulostí. Hranice mezi oběma světy se setřely. Na jedné straně open source komunita začala váhavě oceňovat profesionální práci komerčních vývojářů. Na straně druhé jsou tu otevřené náruče korporací, které pochopily, že mohou otevřený software prostě integrovat do svých robustních řešení, a nepřímo vydělat i na něčem, co dostaly zadarmo. Základy pro koexistenci světů jsou tedy položeny, a diskuse již nemá tolik ideologickou rovinu. Pro konzumenty datových řešení to je dobrá zpráva. Ani jeden směr vývoje se neztratí, a lidé mají na výběr mezi vyladěným komerčním softwarem anebo časovou investicí do open source. Svobodný software zde bude pro experimentátory a technické nadšence, zatímco pro přátele efektivity a nejkratších cest zůstanou jasnou volbou komerční řešení.  
V posledních letech vidíme i ze strany velkých softwarových gigantů, jako je Microsoft nebo IBM upřímnou snahu směrem k otvírání platforem a získávání zákazníků, kteří nahlédli do obou světů. Microsoft začal podporovat Linuxové distribuce na svých Azure serverech, IBM zase integruje neznámější otevřený analytický systém „R“ do svých produktových řad pro analytiky „SPSS“ a „Neteeza“. 


Co bude až nebudou Big data a Cloud? 

Velká slova či buzz-wordy typu „Big data“ a „Cloud“ mají krátký dech a do 10-ti let od svého vzniku se rozplynou. Tou dobou bychom tu měli mít spolehlivé a levné služby pro reporting, analytiku a skoring zákazníků. Nikdo se ovšem již nebude chlubit tím, kolik terabajtů surových dat skladuje, jak velké má servery, či zda jsou uloženy ve Spojených státech. Datová skladiště totiž stojí na špatné straně finančních rozvah, a to na straně nákladů. Důvodem ke spokojenosti bude, pokud se většina organizací dostane ke skutečnému využití dat pro péči a rozvoj zákazníků, k redukci bezpečnostních rizik či daňových úniků.  

Efektivita nebo soukromí 

Z celkem okrajové oblasti využití dat se do konce desetiletí stane centrální téma pro firmy i občany.  Volba mezi efektivitou a soukromím se postupně zviditelňuje a dostává konkrétní obrysy.
Spolu s tím, jak se bude zvyšovat tlak korporací a státu na využití dat, se i spotřebitel či občan začne vehementněji ptát, jaká vlastně data se o něm sbírají a na co se využívají. Poměrně napřed je v tomto trendu Evropská komise, která bedlivě sleduje aktivity velkých online hráčů, a vymezuje jim hřiště. Sladká naivita, kdy aplikace pro Android získá mnoho dat výměnou za nějakou okrajovou funkcionalitu, brzy skončí. I spotřebitel bude za svá data požadovat skutečně nadstandardní funkcionalitu, a hlavně se ujistí, že data budou pracovat v jeho prospěch. Nebude již zkrátka možné data jednostranně vysávat a nic za ně nenabídnout.
Do zajímavého experimentu se v tomto směru pouští Microsoft, který ve Windows 10 požaduje od uživatelů velké množství dat. Otázkou je, zda výhody moderního operačního systému převáží nad kompromisy v soukromí, a zda uživatelé budou tento výměnný obchod akceptovat, nebo se pustí do ochrany svého soukromí, a sdílení dat si jednoduše vypnou. Odpověď bychom měli dostat právě v roce 2016.
Data pro korporace budou i nadále znamenat především cílení nabídek podle profilu uživatelů. Oblast cílených nabídek není zdaleka vyčerpána a zanedlouho již převáží nad přebujelým elektronickým spamem.
Tento směr potvrzuje i nadzvukovou rychlostí rostoucí trh s tzv. „real time bidding“, v oblasti cílené digitální reklamy. Růsty tržeb např. Adform za posledních 12 měsíců jsou obdivuhodné, navíc potvrzují správnost využití získaných dat o spotřebiteli a další potenciál!
Ruku v ruce s podílem vyhledávání a provedených transakcí pomocí mobilních zařízení se bude tento typ reklamního cílení směrem k zákazníkovi více zpřesňovat.
Spolu s tím, jak se bude zrychlovat reakce nabídky na aktivitu uživatele, ovšem někteří lidé znervózní a bude se rozvíjet trh se soukromými, nesledovanými nástroji. První vlaštovky chránící spotřebitele jsou již na světě, jmenujme třeba projekt „Tor“ pro anonymní brouzdání po internetu. Zatímco v online prostředí si člověk může zajistit alespoň trochu anonymity, v jiných odvětvích je jeho soukromí v rukou businessu a regulátorů. Telekomunikační, energetická a bankovní data lze v praxi velmi těžko „smazat“ a spotřebitel se o ně dělí s operátorem víceméně nedobrovolně. Zvyšování tlaku bude následovat na obou stranách. Majitelé dat se budou snažit svá data zpeněžovat pomocí relevantní reklamy a regulátoři budou bojovat za ochranu soukromí. Pochopitelně, jako v minulosti, nedojde k žádnému definitivnímu vítězství či porážce ani na jedné ze stran, a přetahovaná nebude mít konce.

 

Jan Matoušek a Marek Čerňanský, Data Mind s.r.o.

Původně pro časopis Connect! (Příloha časopisů Computer a Euro)

Blog
Oblíbené
201720162015201420132012201120102009
Zpět na hlavní menu
Kontakt:

Data Mind s.r.o.

Telefon: +420 720 705 639, +420 220 386 449
E-mail: info@datamind.cz
Sídlo: U Průhonu 22 / 466, Praha 7 – Holešovice, 170 00
IČO: 28953789

face.png, 26 kB Mgr. Jan Matoušek

Telefon: +420 720 705 639
E-mail: jan.matousek@datamind.cz


linkedin.com
Napište nám vzkaz:
captcha