Innehållsförteckning:
Definition - Vad betyder utvinning?
Extraktion är processen för att hämta relevant information från datakällor i ett specifikt mönster för användning i en datalagermiljö. Extraktion lägger till betydelse för data och är det första steget i datatransformeringsprocessen. Extraktionen tar bara ut vissa data som passar ett villkor eller en kategori från en enorm insamling av data som kommer från olika källor.
Techopedia förklarar extraktion
I en datalagringsmiljö måste en enorm insamling av data från olika strukturer och ostrukturerade källor bearbetas, omvandlas och lagras för att härleda meningsfulla slutsatser och förutsägelser. Uppgifterna från de primära källorna måste importeras till datalagringssystemet på ett systematiskt sätt som gör det enkelt att utföra de olika dataoperationerna. Denna process kallas extraktion. Extraktion lägger till struktur på annat sätt ostrukturerad data genom att följa vissa regler. Följande är några av de tekniker som används vid utvinning av data:
- Mönstermatchning
- Tabellbaserad strategi
- Textanalys
