Datasjans överlevnadsguide: vad, varför och hur för datasjön

2026

Tidigare, när man tänkte på digital data, var det vettigt att separera data mellan transaktionsdata, de data som fångats i affärsapplikationer, lagrade i databastabeller och presenterade av BI-verktyg och all annan data: e-post, webbsidor, bilder, video och så vidare. I dag tenderar vi att hänvisa till sådana ”andra data” som ostrukturerade data.

Ändå var det analyserbart och mjukvara för att härleda värde från sådana data har korsat krasmen. Det var det analytiska imperativet mer än något annat som gav upphov till det ursprungliga konceptet med en datasjö, ett datalager för båda typerna av data och dessutom för data som skördats från flera källor utanför verksamheten, varav vissa oundvikligen ostrukturerade.

I den här artikeln kommer vi att undersöka hur det nya ekosystemet som skapas av datasjön inte längre helt kommer att bestå av verksamhetens transaktioner (eller händelser). Det kommer också att inkludera data från andra källor, som företaget använder för att utföra analyser och informera sina användare om viktig information om vilka beslut som kan baseras. Registreringssystemet kommer, som det alltid var, den gyllene kopian av företagsdata och revisionsspåret för företagets IT-verksamhet.