fredag 31 oktober 2014

Släng dina data i sjön - Computer Sweden

Släng dina data i sjön - Computer Sweden




En anledning att satsa på en datasjö med låga krav på
struktur är att det ofta blir orimligt jobbigt att skapa ett
traditionellt datalager.




"En
risk är att man överlåter mycket av arbetet till slutanvändarna. Det
kan lätt bli fel. Om man slarvar med dokumentation och styrning kan en
datasjö lätt bli en big data-kyrkogård."
 
– Huvudpunkten med datasjöar
är att it blir en enorm flaskhals om alla data som ska analyseras ska in
i traditionella datalager. Datalager måste förberedas och integreras,
vilket tar tid, säger Jonas Gummesson, beslutsstödsansvarig på Sogeti i
Sverige.


Valet av en datasjöstrategi kan alltså vara framtvingad av livets realiteter. Sådana kompromisser brukar få konsekvenser.


– En risk är att man överlåter
mycket av arbetet till slutanvändarna. Det kan lätt bli fel. Om man
slarvar med dokumentation och styrning kan en datasjö lätt bli en big
data-kyrkogård, säger Jonas Gummesson.


Niklas Johansson ansvarar för leverans av beslutsstödsprojekt på SEB. Han känner väl till tankarna om datasjöar.


– Jag är övertygad om att vi kommer
att satsa på datasjöar. Vi bevakar området, men har inte hunnit
identifiera något bra första projekt.


Vad skulle drivkraften vara för att satsa på en datasjö?


– Strukturerade data tar vi hand om i
dag. Men det finns hur mycket ostrukturerade data som helst som är
svåra att lagra i en relationsdatabas. I framtiden tror jag att
datalager kan samverka med datasjöar som till exempel sköts med Hadoop.


Vilken typ av analyser skulle passa för att sköta med en datasjö?


– I dag vet vi inte vilka analyser
vi vill göra om ett år, men vi vet att vi kommer vilja gå tillbaka i
tiden och analysera historisk information, även information som vi i dag
inte har i våra system.


Nyckeln till framgång är alltså att lagra så mycket data som möjligt. Hur ska man gå till väga rent praktiskt för att komma i gång med datasjöar?


– Jag skulle rekommendera att köra i
gång ett litet pilotprojekt, i vilket man hanterar ett extrakt av en
större datamängd, för att bevisa värdet med strategin, säger Niklas
Johansson.


Ett praktiskt exempel är att
utnyttjainformation som finns i fritextfält. Niklas Johansson nämner
företag inom bilbranschen som analyserar förekomsten av ord och lyckas
identifiera följdfel och hitta rotorsaker. Under service och
reparationer kan de förbättra sina insatser och undvika framtida fel och
reparationer, vilket minskar kostnaden för kunden. Det är också
värdefull information för tillverkare, som kan utveckla bättre bilar.

Inga kommentarer:

Skicka en kommentar