Hem databaser Vad är kunskapsupptäckt i databaser (kdd)? - definition från techopedia

Vad är kunskapsupptäckt i databaser (kdd)? - definition från techopedia

Innehållsförteckning:

Anonim

Definition - Vad betyder kunskapsupptäckt i databaser (KDD)?

Kunskapsupptäckt i databaser (KDD) är processen för att upptäcka användbar kunskap från en datainsamling. Denna allmänt använda data mining-teknik är en process som inkluderar beredning och urval av data, rensning av data, införlivande av förkunskaper om datamängder och tolkning av exakta lösningar från de observerade resultaten.

Viktiga KDD-applikationsområden inkluderar marknadsföring, bedrägeri, telekommunikation och tillverkning.

Techopedia förklarar kunskapsupptäckt i databaser (KDD)

Traditionellt utfördes data mining och kunskapsupptäckt manuellt. Med tiden gick mängden data i många system till större än terabyte och kunde inte längre hållas manuellt. För att lyckas med något företag anses dessutom att det är viktigt att upptäcka underliggande mönster i data. Som ett resultat utvecklades flera mjukvaruverktyg för att upptäcka dolda data och göra antaganden, som utgjorde en del av konstgjord intelligens.

KDD-processen har nått sin topp under de senaste tio åren. Det innehåller nu många olika tillvägagångssätt för upptäckt, som inkluderar induktivt lärande, Bayesiansk statistik, semantisk frågaoptimering, kunskapsförvärv för expertsystem och informationsteori. Det slutliga målet är att extrahera kunskap på hög nivå från lågnivådata.

KDD inkluderar tvärvetenskapliga aktiviteter. Detta omfattar datalagring och åtkomst, skalningsalgoritmer till massiva datamängder och tolkningsresultat. Datarengörings- och datatillgångsprocessen som ingår i datalagring underlättar KDD-processen. Konstgjord intelligens stöder också KDD genom att upptäcka empiriska lagar från experiment och observationer. Mönstren som känns igen i uppgifterna måste vara giltiga på nya data och ha viss grad av säkerhet. Dessa mönster betraktas som ny kunskap. Steg som är involverade i hela KDD-processen är:

  1. Identifiera målet för KDD-processen ur kundens perspektiv.
  2. Förstå applikationsdomäner och de kunskaper som krävs
  3. Välj en måldataset eller en deluppsättning av dataprover som upptäckten utförs på.
  4. Rensa och förbereda data genom att besluta strategier för att hantera saknade fält och ändra data enligt kraven.
  5. Förenkla datamängden genom att ta bort oönskade variabler. Analysera sedan användbara funktioner som kan användas för att representera data, beroende på målet eller uppgiften.
  6. Matcha KDD-mål med metoder för data mining för att föreslå dolda mönster.
  7. Välj data mining-algoritmer för att upptäcka dolda mönster. Denna process inkluderar beslut om vilka modeller och parametrar som kan vara lämpliga för den övergripande KDD-processen.
  8. Sök efter mönster av intresse i en viss representativ form, som inkluderar klassificeringsregler eller träd, regression och kluster.
  9. Tolk väsentlig kunskap från de utvalda mönstren.
  10. Använd kunskapen och integrera den i ett annat system för ytterligare åtgärder.
  11. Dokumentera det och göra rapporter för intresserade parter.
Vad är kunskapsupptäckt i databaser (kdd)? - definition från techopedia