Innehållsförteckning:
Definition - Vad betyder karaktärisering?
Karaktärisering är en stordatametodik som används för att generera beskrivande parametrar som effektivt beskriver egenskaper och beteende hos en viss datapost. Detta används sedan i oövervakade inlärningsalgoritmer för att hitta mönster, kluster och trender utan att inkludera klassetiketter som kan ha fördomar. Det har sina användningar i klusteranalys och till och med djup inlärning.
Techopedia förklarar karaktärisering
Big data karakterisering är en teknik för att omvandla rådata till användbar information, som används i maskininlärningsalgoritmer och data mining. Karakterisering genererar väsentligen kondenserade representationer av oavsett informationsinnehåll som är dold i data. Därför kan det användas som ett sätt att mäta och spåra händelser, förändringar och nya framträdande beteenden i stora dynamiska dataströmmar.
Några fördelar med karakterisering:
- Kan generera användbara mätvärden för att spåra och mäta händelser och avvikelser i datauppsättningar
- Skapar små fotavtrycksrepresentationer av viktig information
- Gör snabbt data-till-information-omvandling, vilket bringar branschen närmare den fullständiga data-till-information-till-kunskapstransformationen
- Är användbar för att indexera och tagga specifika objekt, händelser och andra funktioner i en datainsamling