Vad är data mining?

Ämne: Avancerad Analys

I veckan kunde man läsa i Dagens Industri om att Tesco ska erbjuda manliga blöjköpare billigare öl. ”Bolagets egna undersökningar visar nämligen att nyblivna fäder köper mer öl i butik…”. Man kan ju tycka att deras undersökning var nog bortkastade pengar då detta exempel är nog ett av de äldsta och det absolut vanligaste exemplet på användningen av data mining i daglivaruhandeln. Men vad är egentligen data mining?

Data mining, prediktiv analys, artificiell intelligence, tidsserieanalys, prognostiering, maskininlärning… kärt barn har många namn. Alla dessa begrepp är inte synonymer, men när de används i kontextet business intelligence är det ofta samma sak man syftar på. Det handlar om att leta efter mönster i data som är för komplexa för mänskliga hjärnan att upptäcka och att sedan använda dessa mönster för att göra uppskattningar på okänd information. Det skulle kunna vara mönster i kunders beteende som används för att segmentera kunderna, eller mönster i den historiska försäljning som används för att prediktera nästa månads försäljning. Eller som i exemplet ovan att titta på hur olika produkter har sålt historiskt för att kunna hitta tidigare okända vanliga kombinationer. Kunskapen man får fram används för att optimera processer, öka vinst eller minska utgifter.

En mer formell definition av data minning skulle kunna vara ”processen där man applicerar algoritmer på datamängder för att hitta olika typer av tidigare okända eller dolda mönster.” Men detta belyser endast den tekniska aspekten av data mining. Idag erbjuder alla business intelligence verktyg möjligheten att använda sig av data mining. Det är förstås viktigt att ha ett bra verktyg när man ska arbeta med den här typen av avancerad analys, men hög data kvalitet samt en kombinerad förståelse av både algoritmer och verksamheten är minst lika viktigt för framgångsrik data mining.