Na přelomu století vítězila v boji databázových systémů Teradata. Její databáze nebyla nejrozšířenější, ale zato byla nejdražší. Zákazníci z řad telekomunikačních společností a bank za ni platili „premium“, protože šéfům odborníci radili, že je nejrychlejší. Dopomohl tomu dokonalý přehled Teradaty nad fyzickou vrstvou implementace. V té době to znamenalo zejména detailní porozumění diskům, plotnám, pamětem a softwaru. Jen optimalizací souběhu tradičních pevných disků se podařilo Teradatě dobýt trůn nejvýkonnějšího databázového systému své doby.
Nyní je ale rok 2017. Vypadá to, že fyzická vrstva dat nezajímá již vůbec nikoho. Všichni zapomněli, že i Google začal budováním datacenter a originální fyzickou implementaci ruku v ruce se softwarovými inovacemi. Porozumění SSD diskům, jejich řadičům a rozhraním již není atraktivní ani v kurzu. Vnímám, že polovina datového národa zírá tupě do oblak a doufá, že jim spásu přinese uživatelství (!) cloudových služeb u Amazonu či Googlu. Čas dal narodit se úspěšným projektům jako je český datový integrátor Keboola či globálně úspěšné cloudové CRM SalesForce. Pionýři cloudové analytiky již mají úspěch zaručen, ale desítky jejich následovníků, co přicházejí den co den do „startupyardů“ ne. Datové projekty se nikdy nemohou stát originálními, pokud jen olizují svrchní vrstvu infrastruktury Amazonu a využívají bez vlastních nápadů virtuálních strojů a prostředků. Vítěz, který nezřídka v datové oblasti bere téměř vše, je v případě nenápaditých řešení právě majitel infastruktury. Pokud tedy někdo vyvine další cloudový dashboard, zvýší tím pravděpodobně bohatství vlastníka infastruktury, na které ho postavil, ale ne to svoje.
Nová datová služba je totiž z určitého pohledu již jen zákazník, který zprostředkovává službu dalším zákazníkům. To ovšem není pro většinu malých datových hráčů cesta do oblačných výšin, ale spíše cesta k průměrnosti a k upevnění moci velkých vendorů cloudu. Jsou to totiž oni, kdo kontrolují fyzickou implementační vrstvu, a velmi pravděpodobně tak vyhrají časem i lví podíl na zisku z cloudové ekonomiky. Současná situace, kdy prodávají cloudové služby za komoditní ceny, nemusí trvat věčně, protože vítěz války ekosystémů bude chtít navýšit marže, jakmile bude lapeno kritické množství zákazníků v dostatečně složitých projektech, které se špatně přenášejí.
Pokud slepě nejásáme nad cloudem, je nasnadě otázka, jak to děláme my. Musím přiznat, že klienti nám nevědomky platí i za to, že se staráme o hardwarovou základnu. Ti, kteří si u nás platí skoring a transformace dat, protože jejich vlastní sdílená datacentra mají příliš rozředěnou či drahou kapacitu, mají pocit, že si platí za službu. Ve skutečnosti je to funkční nesdílený hardware, který jim pronajímáme. Vyhrazená kapacita strojů sice není zdarma, ale ani nestojí tolik, co datacentrum se sdílenou kapacitou pro stovky konkurenčních (čti: frustrovaných) uživatelů. Protože nemá cenu čůrat proti větru, připravujeme i u nás na cloudovou budoucnost. Jsme kompatibilní s cloudovými službami a již nyní je pro nás nutné zvládat hybridní implementace mezi cloudem a on-premise řešeními. Kompatibilita ovšem neznamená vždy debilitu, a nemíníme uctívat božstva z mraků příliš slepě, či jim dávat cokoli na oltář. Při obdivném hledění do datového nebe nezapomeňte ani vy na obchodní výsledky.
Video o podnikání v datové analytice: Buduj značku.
Jan Matoušek
29. června 2022