English

Data mining – kde se vzal a co dovede?

Autor: Jan Matoušek, středa, 24. duben 2013

Rozpoznává váš fotoaparát obličeje? Zobrazují se vám relevantní reklamy od Googlu? Pak jste také „obětí“ data miningu – techniky dolování znalostí z databází.


Jsme obklopeni spoustou aplikovaných výpočetních modelů, pro které se vžilo souhrnné označení data mining. Pojďme se blíže podívat na vznik těchto modelů.

Kde se bere?

Data mining je celkem mladý obor, ačkoli některé jeho techniky jsou s námi již velmi dlouho. Například hojně používaná regresní analýza – tedy statistický odhad vývoje jistého jevu, založený na známých datech – pochází z 19. století. Jiné techniky, jako jsou neuronové sítě, se ujaly až s nástupem počítačů a prosazují se od padesátých let minulého století.

Data mining jako samostatný obor se profiluje od relativně nedávných devadesátých let. Nejprve byl spíše označován jako dolování znalostí z databází, a u tohoto označení zůstali někteří čeští akademici. Konsolidaci oboru představovala až metodologická příručka CRISP-DM – představuje určitou obecnou kuchařku v postupu data miningem – která byla dokončena roku 1999. Od té doby je data mining uznávaným oborem na křižovatce byznysu, matematiky a akademického výzkumu.

Ačkoli hlavní využití data miningu je v marketingu, obor se neomezuje jen na cílení kampaní. Data mining je zároveň poněkud nestravitelný pro akademické matematiky, protože postupuje cestou nejmenšího odporu ke kvalitním znalostem – často porušuje principy matematické práce.

V zásadě je data mining stejný buzzword, jako například cloud computing. Dává rámec velmi odlišným technologiím a postupům. Společným jmenovatelem je jen využití možností statistiky a umělé inteligence ve spojení s velkými databázemi. Co bývá často jako data mining označováno, ale rozhodně sem nepatří, je sběr dat z webových stránek. Ten je správněji označován jako data harvesting (sklízení dat) nebo web scraping. 

Jsme jenom nosiči dat

V zákaznicky orientovaném byznysu má nyní data mining zcela jednoznačnou úlohu v rámci Business Inteligence či CRM. Jeho smyslem je třídit zákazníky, produkty, nebo i potenciální trhy do konzistentních celků. Slouží tedy nejčastěji marketingu středních a větších společností.

Nasazení data miningu nastane v typické firmě ve chvíli, kdy se zastaví růst daný plošnou reklamou. Manažeři, jejichž zisky nestoupají tak jako v minulosti, hledají řešení. Data mining pak mění směřování firmy od cíle zasáhnout komunikací co nejvíce zákazníků k cíli mířit komunikaci na ty, kdo nejspíše koupí.

V marketingovém pojetí se pro data miningové techniky používají termíny jako je afinita (pravděpodobnost koupit produkt), churn management (zadržení zákazníků, kteří by jinak odešli ke konkurenci) nebo fraud management (ošetření podvodů).

Zákazníci jsou různé živočišné druhy

Velmi populární technikou je segmentace zákazníků. Jejím účelem je nalézt skupiny klientů, kteří mají společné potřeby. Mezi segmenty jsou ve výsledku velké rozdíly a uvnitř segmentů jsou rozdíly malé.

Podívejme se nyní na projekt segmentace zákazníků. Obchod XY prodává již deset let počítače. Protože však plošná komunikace e-mailem má snižující se účinek, management pojal záměr přijít se segmentovanou komunikací. V komunikaci je potřebu oddělit nadšence, kteří dokážou vyjmenovat o půlnoci 14 parametrů procesoru, od uživatelů, jež používají PC jen jako videopřehrávač. 

Při segmentaci bylo použito mnoho proměnných z oblasti věrnosti zákazníka a citlivosti na cenu, primárním cílem bylo ovšem oddělit hodnotné a pokročilé zákazníky od nenáročných.

Výsledkem bylo pět segmentů – od náhodných kolemjdoucích, kteří si zajdou koupit myš k počítači, po skutečné počítačové nadšence. Pokročilá skupina počítačových nadšenců se neklamně projevuje nákupem silného chlazení pro přetaktování procesorů a někteří dávají k dobrému velmi podrobné recenze na jednotlivé počítačové komponenty. Mezi těmito extrémními segmenty se nacházejí průměrní uživatelé. Ti se dále dělí na zákazníky orientované na mobilitu (notebookáři) a běžné uživatele „velkého“ PC.

Po nasazení do marketingového oddělení bylo možno tvořit segmentované nabídky. Na zákazníky, kteří dokážou vyhodnotit parametry počítačových dílů, směřovala technicky orientovaná  komunikace. Naopak všeobecná a cenová komunikace mohla být směřována do segmentů běžných uživatelů PC. Mobilní zákazníci dostávali nabídky mobilních zařízení. K segmentům budou přiřazeny komunikační kanály, přičemž papírovou nabídku dostanou hodnotné segmenty, segmenty s nízkou hodnotou zůstanou na e-mailové komunikaci.

Data mining přeje připraveným

Pro řízení projektu v data miningu je zcela klíčových několik předpokladů. V první řadě musí být marketing společnosti připraven na implementaci složitějšího cílení na zákazníky. Dosáhne vyššího zisku, ovšem bude muset investovat kreativní kapacitu do vymýšlení více variant komunikace. Pověření marketéři musí chápat, že data miningový model přinese daleko přesnější oslovení cílových skupin. V druhé řadě musí mít data miningový projekt prioritu od vedení společnosti a podporu IT.

Výsledky data miningu je vhodné vždy vyhodnocovat. Komunikaci pak musí reflekovat charakter vytvořených segmentů. Zásadní je proto vhled do potřeb segmentů. Marketér, který je zodpovědný za řízení segmentu nadšenců by měl být sám zaujatý technikou, nebo alespoň takové zaujetí chápat. Naopak v segmentu běžných uživatelů je třeba komunikovat obecné výhody nových PC a zdržet se technických argumentů.

Implementace data miningových modelů probíhá obvykle do databáze zákazníků. V této fázi je nutná podpora oddělení IT. Vhodné je tedy budovat zapojení budoucích implementátorů řešení daleko dříve, než když je projekt dokončen.

Ideální je pro data miningový projekt sestavit smíšený tým, který má vhled do běžné komunikace se zákazníky, do dat i do systémů. Projektový tým se může scházet například jen v okamžicích „milníků“ projektu, neměl by však projekt zcela pustit ze zřetele. Zapojení důležitých lidí je totiž v data miningu jasnou podmínkou úspěchu.

Současnost a budoucnost data miningu v ČR

V současné době je data mining používán v České republice zejména telekomunikačními společnostmi a bankami. Tyto instituce mají desítky modelů zákaznického chování v provozu a dokážou tak cílit nabídky i na zcela specifické skupiny zákazníků. Typická telekomunikační společnost má model pro zákazníky, kteří mohou chtít dát výpověď, a model pravděpodobnosti prodeje klíčových produktů. Vedle toho má ještě obecnou segmentaci pro cílení nabídek. Banky provozují vedle výše zmíněných modelů, ještě modely kreditního rizika zákazníků a modely pro detekci podvodů (fraud).

V poslední době je znát příklon středně velkých společností k data miningu, zejména v oblasti retailu, který již shromáždil velké množství dat od zákazníků. Retail se typicky zabývá modely nákupního košíku, které určují, který produkt se prodá s kterým. Dávají tak vzniknout produktovým balíčkům nebo cíleným nabídkám.

Očekávám, že v blízké budoucnosti čeká data mining spojení s geolokačnímu službami a tzv. marketingem rychlé reakce, kdy na základě aktivity zákazníka dochází k okamžité tvorbě nabídky. Celkem jistě se tak setkáme s rychlými nabídkami založenými na okamžitém chování na webu. Nabídky cílené dle lokalit jsou již v plném běhu. Trend je jednoznačný: doručit správnému zákazníkovi správnou nabídku. Pokročilé služby k tomu dodají ještě dvě věci: místo a čas. Správná nabídka tak bude doručena ve správném čase a na správném místě. Průkopníkem v této oblasti je například Google, který disponuje neuvěřitelnou analytickou kapacitou.

Publikováno Computer/Connect

Blog
Oblíbené
201720162015201420132012201120102009
Zpět na hlavní menu
Kontakt:

Data Mind s.r.o.

Telefon: +420 720 705 639, +420 220 386 449
E-mail: info@datamind.cz
Sídlo: U Průhonu 22 / 466, Praha 7 – Holešovice, 170 00
IČO: 28953789

face.png, 26 kB Mgr. Jan Matoušek

Telefon: +420 720 705 639
E-mail: jan.matousek@datamind.cz


linkedin.com
Napište nám vzkaz:
captcha