onsdag 12 juni 2013

Prisras för dataanalys - Computer Sweden

Prisras för dataanalys - Computer Sweden

Billigare minnen och processorer i kombination med bättre prestanda gör det lättare att i realtid analysera stora datamängder.

(CS/Amsterdam) För en kostnad under 200 000 kronor får man ett system, hårdvara och program som i realtid kan analysera persondata från hela Europas befolkning. Det hävdar Mikael Hagström, chef för Europa och Asien på Sas Institute.

– Big data är inte längre något enbart för it-experter. I dag kan det användas av alla i en organisation och det finns exempel på företag som har infört det för alla anställda.


Beslutsstöd, eller business intelligence, var tidigare något som började med att data strukturerades. Priset på minne gjorde analyser av stora ostrukturerade datamängder alltför dyra. Så är det inte i dag. Nu behöver inte data struktureras och analyser kan göras på hela datamängden, inte bara på delmängder.

För att illustrera hur mycket snabbare det kan göras i dag tar Mikael Hagström riskanalysen i en bank som exempel. Förr användes oftast så kallad Monte Carlo-simulering. Det innebär att man inte behandlar så mycket data åt gången, men utför desto fler transaktioner. Metoden tar två till tre dagar att utföra.

– Vissa dagar visste du inte ens risknivån i banken. I dag tar en riskanalys en till fem minuter. Det finns en bank som genomför en global riskanalys på 4,5 minuter, säger Mikael Hagström.

På Sas Institutes användarkonferens i Amsterdam kan företaget visa hur visualisering av en miljard rader oindexerade data kan göras på en till två sekunder. Det sker med Visual Analytics som i demonstrationen körs på 64 bladservar. Det ger också ett exempel på de fallande priserna.

När Visual Analytics lanserades för drygt ett år sedan kördes den på 96 bladservrar. Nu finns den i en version för en server.

Tidigare har dataanalys byggt på att testa en hypotes. Det var viktigt att både kunna formulera frågan och tolka resultatet. Så är det inte längre.

– Vem som helst kan ställa frågan och köra hela datamängden i realtid. Genom visualisering kan du hitta samband på sekunder, mot tidigare flera dagar.

Mikael Hagström ifrågasätter också hur begreppet big data an-vänds. Ofta handlar det om interna data, som i många fall flerfaldigas, till exempel när det ligger på flera databaser.

Han är också kritisk till hur projekt oftast drivs.

– De startar hos it-avdelningen och blir till en extra kostnad i form av större lagringskapacitet. Det skapas ett it-projekt och inte ett analysprojekt.

Det börjar finnas gott om exempel på lyckade analysprojekt. Mikael Hagströms favorit tycks vara ett som genomfördes av en icke namngiven japansk teleoperatör som ville sälja ringsignaler. Kunskap om kundernas musiksmak var nödvändig, men teleoperatören saknade den kunskapen. Genom olika analyser av kunddata i kombination med agerande på sociala medier kunde operatören till slut utmana jätten Sony med en helt ny musiktjänst.

– Det är analys av interna och externa data som är styrkan. 80 procent av dagens typer av data existerade inte för fyra år sedan.

Det går inte att undgå frågan om den personliga integriteten när det gäller analys av stora datamängder. Sas Institute försöker att komma ifrån att lagra individdata genom att segmentera och profilera dem. Därför är Mikael Hagström mycket kritisk till förslaget till ny datalag från EU-kommissionen.

– På en punkt vill kommissionen förbjuda teknik för profilering, men som vi vet har lagstiftning mot teknikanvändning aldrig varit särskilt framgångsrik.

Han anser att profileringsteknik också är till för att skydda den personliga integriteten.

– Det går att lösa med en annan formulering i förslaget.

Han ser också stora problem med att realisera rätten för en individ att bli glömd, det vill säga att få sina data raderade.

– Det går att lösa, men det blir nog väldigt dyrt med tanke på hur internet fungerar.

Inga kommentarer:

Skicka en kommentar