Innehållsförteckning:
- Engagera alla affärssektioner i ett big data-initiativ
- Utvärdera alla infrastrukturmodeller för implementering av big data
- Överväg traditionella datakällor i big data-planering
- Överväg en konsekvent uppsättning data
- Distribuera data
- Lita inte någonsin på en enda metod för analys av big data
- Starta inte stora big data-initiativ innan du är redo
- Använd inte data isolerat
- Ignorera inte datasäkerhet
- Ignorera inte prestandadelen av big data-analys
Big data ger mycket löfte för alla typer av branscher. Om denna stora data utnyttjas effektivt och effektivt kan det ha en betydande inverkan på beslutsfattande och analys. Men fördelen med big data kan endast uppnås om den hanteras på ett strukturerat sätt. De bästa metoderna för big data fastställs gradvis, men det finns redan några tydliga do-och-don'ts när det gäller genomförandet.
Följande vägledning är baserad på praktisk erfarenhet och kunskap som samlats in från verkliga projekt. Här är mina bästa big data do's and don'ts.
Engagera alla affärssektioner i ett big data-initiativ
Ett big data-initiativ är inte en isolerad och oberoende aktivitet, och engagemanget för alla affärsenheter är ett måste för att få verkligt värde och insikt. Big data kan hjälpa organisationer att utnyttja stora mängder data och få inblick i kundbeteende, händelser, trender, förutsägelser etc. Detta är inte möjligt med en datorbild som bara fångar en del av hela volymen av data som behandlas i big data. Som ett resultat koncentrerar företag sig mer och mer på alla typer av data som kommer från alla möjliga vägar / affärsenheter för att förstå rätt mönster.Utvärdera alla infrastrukturmodeller för implementering av big data
Datavolymen och dess hantering är ett stort problem för alla big data-initiativ. Eftersom big data handlar om petabytes av data, är den enda lösningen att hantera den genom att använda datacentra. Samtidigt måste kostnadskomponenten beaktas innan man väljer och slutför någon lagringsanläggning. Molntjänster är ofta det bästa valet, men tjänsterna i olika molnmiljöer måste utvärderas för att bestämma den lämpliga. Eftersom lagring är en av de viktigaste komponenterna i all big data-implementering är det en faktor som bör utvärderas mycket noggrant i alla big data-initiativ. (Få ett annat perspektiv i dagens Big Data-utmaning härrör från variation, inte volym eller hastighet.)Överväg traditionella datakällor i big data-planering
Det finns olika källor till big data och antalet källor ökar också dag för dag. Denna enorma datamängd används som input till stordatabehandling. Som ett resultat tycker vissa företag att traditionella datakällor inte är till någon nytta. Detta är inte sant, eftersom dessa traditionella data är en kritisk komponent för framgången för alla big data-historier. Traditionell data innehåller värdefull information, så den bör användas tillsammans med andra stora datakällor. Det verkliga värdet på big data kan endast härledas om alla datakällor (traditionella och icke-traditionella) beaktas. (Lär dig mer i Take That, Big Data! Varför små data kan packa en större stans.)Överväg en konsekvent uppsättning data
I en stordatamiljö kommer data från olika källor. Format, struktur och datatyper varierar från en källa till en annan. Den viktigaste delen är att uppgifterna inte rengörs när det gäller din big data-miljö. Så innan du litar på inkommande data måste du kontrollera konsistensen genom upprepad observation och analys. När dataens konsistens har bekräftats kan de behandlas som en konsekvent uppsättning metadata. Att hitta en konsekvent uppsättning metadata genom noggrann observation av mönstret är en viktig övning i all big data-planering.Distribuera data
Datavolymen är ett stort problem när vi överväger en bearbetningsmiljö. På grund av den enorma mängden data som big data hanterar är bearbetning på en enda server inte möjlig. Lösningen är en Hadoop-miljö, som är en distribuerad datormiljö som körs på hårdvara. Det ger kraften i snabbare bearbetning på flera noder. (Läs mer i 7 saker att veta om Hadoop.)Lita inte någonsin på en enda metod för analys av big data
Det finns olika tekniker på marknaden för bearbetning av big data. Grunden för all big data-teknik är Apache Hadoop och MapReduce. Därför är det viktigt att utvärdera rätt teknik för rätt ändamål. Några av de viktiga analysmetoderna är prediktiv analys, receptbelagd analys, textanalys, strömdataanalys, etc. Val av lämplig metod / metod är viktig för att uppnå önskat mål. Det är bäst att undvika att lita på en enda metod, men att undersöka olika tillvägagångssätt och välja den perfekta matchen för din lösning.Starta inte stora big data-initiativ innan du är redo
Det rekommenderas alltid att börja med små steg för alla big data-initiativ. Så börja med pilotprojekt för att få kunskap och sedan gå till faktiskt genomförande. Potentialen hos big data är mycket imponerande, men det verkliga värdet kan endast uppnås när vi minskar våra misstag och får mer expertis.Använd inte data isolerat
Stora datakällor är spridda runt oss och de ökar dag för dag. Det är viktigt att integrera alla dessa data för att få korrekt analysutgång. Olika verktyg finns tillgängliga på marknaden för dataintegration, men de bör utvärderas ordentligt före användning. Integration av big data är en komplex uppgift eftersom data från olika källor har olika format, men det krävs mycket för att få ett bra analysresultat.Ignorera inte datasäkerhet
Datasäkerhet är en viktig faktor vid planering av big data. Inledningsvis (innan du gör någon bearbetning) finns uppgifterna i petabyt, så säkerheten implementeras inte strikt. Men efter en del bearbetning får du en delmängd data som ger lite insikt. Vid denna tidpunkt blir datasäkerhet avgörande. Ju mer data behandlas och finjusteras, desto mer värdefullt blir det ofta för en organisation. Denna fininställda utgångsdata är immateriella rättigheter och måste skyddas. Datasäkerhet måste implementeras som en del av livscykeln för big data.Ignorera inte prestandadelen av big data-analys
Produktionen av big data-analys är bara användbar när den ger bra prestanda. Big data ger mer insikt baserat på bearbetning av en enorm mängd data med snabbare hastighet. Därför är det viktigt att hantera det effektivt och effektivt. Om prestandan för big data inte hanteras noggrant kommer det att orsaka problem och göra hela ansträngningen meningslös.
I vår diskussion har vi fokuserat på att göra och inte göra med big data-initiativ. Big data är ett växande område och när det gäller implementering är många företag fortfarande i planeringsfasen. Det är viktigt att förstå bästa datapraxis för att minimera risker och misstag. Diskussionspunkterna har härrörts från live-projektupplevelser, så det kommer att ge några riktlinjer för att göra en big data-strategi framgångsrik.
