English

Mastodont na rozcestí - Microsoft SQL Server 2012

Autor: Jan Matoušek, pondělí, 22. říjen 2012

Dostojí softwarový gigant změnám, které se udály na trhu s databázovým softwarem? Podoba dat se za posledních pět let radikálně změnila, stejně jako způsoby práce s nimi. Bude Microsoft pouze následovat trendy, nebo se odváží nějaký nastolit? Přinášíme analytický pohled na Microsoft SQL Server 2012.


Letošní rok je zcela přelomový v tom, že některé léta vytvářené trendy v datové oblasti již nabírají konkrétní podobu. Jedná se o tyto novinky:

  • Analýza a uchovávání nestrukturovaných dat, zejména textových dokumentů
  • Analýzy a reporting v operační paměti místo na disku (In-memory analýzy)
     

Přičtěme k nim evergreeny datového kolbiště:

  • Exponenciální nárůst objemu dat a módní vlna „Big Data“
  • Migrace na open source, zejména v oborech postižených krizí či nedostatkem financí.
     

Výrazným trendem je umísťování dat na obláčky, pardon do sdílených datových úložišť. Tento trend je znám pod marketingovým termínem:

  • Cloud computing
     

Kromě trendů jsou tu požadavky, které SQL Server plní dlouhá léta a na které nemůže jen tak rezignovat. Průměrný databázový administrátor totiž řeší jen dvě klíčové vlastnosti: dostupnost a výkon systému. V obou oblastech je SQL Server rozumně silný a nová verze nesmí být výjimkou.

Podívejme se ovšem, jak se softwarový gigant popasoval s výzvami, kterých je více než dost.

Předem musím zdůraznit, že je téměř nemožné uživatelsky obsáhnut všechny funkce moderního databázového systému. Hodnotím tak SQL Server ze dvou pohledů. Prvním je pohled analytika, který používá databázový systém k transformaci dat a k jednoduchým analýzám. Můj druhý pohled je pohledem nadšence, který sleduje trendy na datovém poli a pokud možno se jich i účastní. Spoustu věcí je ovšem ještě třeba vyzkoušet a použít. Tento článek je tedy prvním pohledem na produkt, ovšem pohledem skutečně nezávislým, nesmlouvavým a analytickým. 

Za hranice relačních databází - plížením vpřed

Microsoft se snažil dostát všem výzvám roku 2012. Dlužno podotknout, že chytá s větším či menším úspěchem několik zajíců najednou. Zároveň si musí uchovat vážnou tvář pro konzervativní korporace a dostát vysokému standardu výkonu a zabezpečení. Když přičteme ostrou konkurenci, celkově nejde o lehkou pozici.

Obr tak adoptuje několik mladých technologií a nechává nás nahlédnout do svého inkubátoru.

Nástroj pro efektivní reporting PowerPivot, o němž zlí jazykové tvrdí, že se podobá úspěšnému mladému projektu Tableau, budí vesměs pozitivní reakce, přičemž recenze nabízejí výroky od nadšeného „technologie roku“ po vlažné prohlášení, že jde o dobrou první verzi. Technologie se blíží standardům moderního reportingu v operační paměti. Nespornou výhodnou je velmi kvalitní integrace s Excelem.

Microsoft si z generace noSQL (Big Data) databází vypůjčuje svůj COLUMNSTORE index, který indexuje sloupce místo celých tabulek. Přejímá tak klíčovou technologii nových databází, která umožňuje zpracovat obrovské objemy dat tím, že v indexu se nachází jen vybrané sloupce tabulek. Přístup Microsoftu je však konzervativní. Používá dekádami prověřený jazyk SQL. Microsoft tím vyjadřuje vcelku konzervativní názor, že z domény Big Data  přijdou velmi dobré nápady, celkově jde však o nedovařený konglomerát technologií, kvůli kterému nemá smysl zatím bořit účelný a funkční svět relačních databází.

I v analýze textových dokumentů se SQL Server pomalu plíží vpřed. Kromě toho, že umožňuje skladovat dokumenty, po určité konfigurační práci umožňuje importovat slovníky klíčových slov a například porovnávat dokumenty na základě podobnosti. Klíčová slova dostávají skóre, podle svého statisticky vypočteného významu. V praxi to znamená, že dokumenty se porovnávají nikoli podle slovní vaty, ale podle unikátních a významotvorných slov v nich. Předpokladem použití v českém jazykovém prostředí je samozřejmě dostupnost českého slovníku a hlavně sémantické logiky pro český jazyk, na což si nejspíše budeme muset počkat pořádně dlouho.

Potřebná infrastruktura pro sémantickou analýzu je sice velkým krokem vpřed, existují však již specializovaná nástroje, které analýzu textu zvládnou s nepoměrně větší flexibilitou. Výhodou SQL Serveru tak zůstává pouze organické propojení textové analýzy s výkonnou relační databází.
Naopak klíčová technologie Always On je na vysokém vývojovém stupni. Jedná se o vylepšení zastupitelnosti redundantních serverů, které se automaticky aktivují v případě výpadku. Vylepšení je mnoho a umožňují lepší rozložení zátěže mezi více serverů se stejným obsahem.

Cloud computing technologie zastupuje propojení s platformou Azure. Propojení vypadá na první pohled solidně a přináší všechny obvyklé výhody hostovaných řešení. Databáze v prostředí oblak - Azure - je plně kompatibilní s SQL Serverem, takže existuje snadná cesta „do oblak“ i zpět.

Technologie v důchodu a Šípkové Růženky

K zaslouženému odpočinku Microsoft odsoudil svůj starý reporting, který zůstává mezi podporovanými službami, avšak nedočkal se výrazného updatu. Tradiční korporace tak mohou zůstat u zastaralého reportingu anebo přejít na flexibilnější PowerPivot. Mnoho z nich však sáhne i po řešení třetích stran.

Stejně tak data mining, který byl v minulých verzích značně neflexibilní oproti specializovaným data miningovým nástrojům, se nedočkal updatu a zůstává tak vhodným nástrojem pro někoho, kdo si chce data mining pouze vyzkoušet, nebo pro něhož tyto technologie stojí na okraji zájmu. Z prohlášení vedení Microsoftu lze vyčíst, že gigant nehodlá konkurovat zavedeným analytickým společnostem jako je SAS nebo SPSS. Technologie data miningu ale musí mít, protože je má konkurence v čele s Oraclem a Teradatou.

Drobných změn se dočkaly integrační služby, které umožňují více než hloupé kopírování z jedné databáze do druhé. Řešení pro datovou integraci nabízí vysokou kompatibilitu s existujícími standardy dat, a nově i podmíněné větve, které se spouští až po splnění určitých podmínek. Celkově však jde o nepříliš flexibilní řešení, které je často nahrazováno samostatným softwarem pro datovou integraci.

Uživatelské rozhraní a instalace

Hlavním uživatelským rozhraním zůstává SQL Server Management Studio v nové verzi. Na první pohled toto centrum pro ovládání SQL Serveru zbytnělo, a při jeho instalaci si tak uvaříte nejen kávu, ale možná i oběd. Ovládací centrum SQL Serveru zabere 2 GB na disku a není nikterak skromné ani při spuštění. Je znát, že vývoj probíhal na procesorech generace Core i7, nebo na odpovídajících serverových procesorech Xeon. Spouštění nástroje tak bude trvat klidně dlouhých 20 sekund. Za to se dočkáte bohaté uživatelské podpory po spuštění, a na poměry databází luxusního ovládání, které je opravdu uživatelsky přívětivé i přes pár drobných chybiček.

Licenční peklo a ráj cen

Každý, kdo to myslí s nasazením SQL Serveru vážně se musí zastavit u licenční politiky. Ta zůstává i ve verzi 2012 relativně komplikovaná a zároveň prošla mnohými změnami. Marketingové řeči o zjednodušení licenční politiky ve verzi 2012 bude lépe ignorovat. Ve skutečnosti, pokud máte již spočtenu cenu své implementace, budete mít projekt ze třetiny hotový.

Cenový ráj nabízí Microsoft jen pro určité skupiny uživatelů. Mezi ně patří nadšenci a malé firmy, kteří dostanou produkt zdarma.  Na druhé straně, pro velké korporace je Microsoft stále levný i přes nedávné zdražení, zejména oproti nejbližší konkurenci firem Oracle a Teradata. Výhodnost vyjde najevo zejména po srovnání celkových nákladů vlastnictví, známých v korporátní hantýrce pod zkratkou TCO a zahrnující správu, údržbu a podobné nákladné „radosti“ spojené s provozem databází. Střední firmy mají rozhodování těžší, ale v mnoha případech bude i pro ně SQL Server nejvýhodnější.

Povězme si nyní o několika relevantních možnostech, které licenční politika nabízí.

Nejnižší verze SQL Serveru, nazvaná Express nabízí v zásadě obrovskou hodnotu zdarma. Má však svoje limity. Konkrétně je citelný limit 10 GB pro velikost databáze. Databází však může být na jednom stroji stovky, takže v praxi může Express obsluhovat i velký balík dat v mnoha databázích. Druhý limit byl značně navýšen od minulých verzí – jedná se o limit na procesor. Verze 2012 podporuje celý čtyřjádrový procesor zdarma, což jí povyšuje na úroveň plnohodnotného řešení pro malá data. Třetím limitem je limit paměti na zpracování dat, který je nastaven na 1 GB. Okolo tohoto omezení existuje velké zmatení, podpořené nepřesnými požadavky na systém přímo na stránkách Microsoftu. V praxi používá SQL Server Express až 1,5 GB paměti, z toho je 1 GB určen na data, a zbytek na obslužné procesy. Ignorujte proto 1 GB uvedený v minimálních požadavcích, pro hladký chod je třeba mít alespoň 3 GB operační paměti. V praxi je SQL Server Express dobré řešení pro malé objemy dat v nekritických aplikacích, mezi které patří analytika a například weby malých firem. Funkce pro korporátní datové sklady pochopitelně ve verzi Express nenajdete. Přesto může Express do určitého objemu dat zdatně konkurovat open source platformám zejména svojí uživatelskou přívětivostí a výbornou kompatibilitou s Windows i s používanými standardy pro propojování dat (ODBC, OLE DB, .NET).

SQL Server Standard je dobrou možností pro střední firmy, které již vyrostly z řešení poskytovaných zdarma. Tato edice nemá nízké limity verze Express, ale zároveň není určena pro velké korporace, protože jí chybí funkce pro velké datové sklady. Cena kompletní licence se může pohybovat již od několika desítek tisíc Kč a skládá se z licence pro server a pro klientské počítače. Za větší peníz si můžete licencovat celá procesorová jádra pro neomezený počet uživatelů.

Novou verzí je Business Inteligence v cenách již v řádu stovek tisíc Kč. Tato verze přidává pokročilejší reporting PowerPivot a je vhodná pro analyticky zaměřené firmy nebo oddělení. Firma získá mnoho reportingových nástrojů a v zásadě neomezenou kapacitu databází za cenu řešitelnou v rámci středně velkých provozů.

Pro velké datové sklady, kritické provozní systémy apod. je jedinou volbou velkých firem verze Enterprise. Tato verze je jedinou kompletní variantou se všemi funkcemi pro datové sklady, řešením zastupitelnosti serverů pomoci technologie Always On apod. Licenční politika je zde zásadně změněna, a nutno podotknout, že je nový Server v typickém scénáři dražší než SQL Server 2008 Enterprise. Licencuje se totiž výhradně na procesorové jádro. Při více procesorech a s několika záložními servery, se bude cena počítat v jednotkách milionů Kč. Licenční politika má zajímavý důsledek pro výrobce hardware – slabší servery s procesory AMD budou zcela vytlačeny z databázového segmentu trhu, protože mají nízký výkon na jedno jádro. Politika tedy pomůže hi-endovým Intel serverům a staré železo od AMD i Intelu půjde v případě nasazení SQL Serveru Enterprise do šrotu.

Kromě standardních verzí nabízí Microsoft i různé speciální a osekané edice. Levnou verzi si vysloužili weboví designéři zjevně proto, že rádi využívají open source platformy, zejména MySQL a PostgreSQL.

Microsoft pochopitelně myslel i na vývojáře a nabídl jim verzi Developer téměř zdarma. Zde se jedna o kopii verze Enterprise, která je vsak určena jen pro vývoj. Kde vývoj aplikací konči a začíná je bohužel předmětem diskusí. Jasné je ovsem, že verze Developer nesmi být nasazena do produkčního prostředí.

Závěr – Tradiční obr neporazí trpaslíky

SQL Server 2012 je perfektní a stabilní pracovní nástroj pro všechny, kdo očekávají univerzální databázi obohacenou o možnost bez problémů migrovat do oblak (na platformu Azure). Nová verze přináší na jedné straně více funkcí ve „free“ ve variantě Express, na druhé straně ale zdražení pro velké korporace ve variantě Enterprise. Vyšší cena pro korporace je ospravedlněná vyšším výkonem a spolehlivostí, v rámci celkových nákladů vlastnictví (TCO) je stále výhodná.

Microsoft udělal několik výletů do domén mladého software, jako jsou in-memory analýzy, sématické  vyhledávání a zpracování velkých dat (Big Data). Některé z těchto výletů se povedly (kladně je hodnocen například nový reporting PowerPivot), jiné zůstaly v půli cesty. Microsoft se vydal několika cestami najednou a jeho řešení kopíruje, avšak neurčuje trendy.

Při rozhodování o upgradu zvažte nejprve náklady a přínosy. Pro uživatele Express odnože je přechod na verzi 2012 jasná volba, za předpokladu, že vlastní současný hardware. Pro některé firmy může představovat nové licencování verze Enterprise finanční problém, pro jiné jde stále o levné a efektivní řešení.

Publikováno Computer / Connect / Živě

Blog
Oblíbené
201720162015201420132012201120102009
Zpět na hlavní menu
Kontakt:

Data Mind s.r.o.

Telefon: +420 720 705 639, +420 220 386 449
E-mail: info@datamind.cz
Sídlo: U Průhonu 22 / 466, Praha 7 – Holešovice, 170 00
IČO: 28953789

face.png, 26 kB Mgr. Jan Matoušek

Telefon: +420 720 705 639
E-mail: jan.matousek@datamind.cz


linkedin.com
Napište nám vzkaz:
captcha