Vad är apache kudu? - definition från techopedia

2025

Innehållsförteckning:

Definition - Vad betyder Apache Kudu?
Techopedia förklarar Apache Kudu

Definition - Vad betyder Apache Kudu?

Apache Kudu är medlem i det öppna källkodssystemet Apache Hadoop. Det är en open source-lagringsmotor avsedd för strukturerad data som stöder slumpmässig åtkomst med låg latens tillsammans med effektiva analytiska åtkomstmönster. Det designades och implementerades för att överbrygga klyftan mellan det mycket använda Hadoop Distribuerade filsystemet (HDFS) och HBase NoSQL-databas. Även om dessa system fortfarande kan vara fördelaktiga kan Apache Kudu tillgodose många vanliga arbetsbelastningar eftersom det dramatiskt kan förenkla deras arkitektur.

Techopedia förklarar Apache Kudu

Apache Kudu utvecklades främst som ett projekt på Cloudera. De flesta bidrag hittills har varit av utvecklare anställda av Cloudera. Under lanseringen inkluderades endast bekvämlighetsbinarier i Clouderas förvar, men det antog källsläppningsprocessen för Apache Software Foundation (ASF) när den anslöt sig till inkubatorn. Det är specifikt utformat för användningsfall som kräver snabb analys av snabbdata. Den var konstruerad för att dra nytta av nästa generations hårdvara och i minnet. Det sänker frågestatensen betydligt för Apache Impala och Apache Spark. Den distribuerar data genom kolumnerande lagringsmotorer eller genom horisontell partitionering och replikerar sedan varje partition med Raft-konsensus, vilket ger låg genomsnittlig tid till återhämtning och låga svansfördröjningar.

Även om Kudu är en produkt designad inom ramen för Apache Hadoop-ekosystemet, stöder den också integration med andra dataanalysprojekt både in och ut ur ASF.

Apache Kudu visar sig vara effektiv eftersom den kan bearbeta analytiska arbetsbelastningar i realtid över ett enda lagringslager, vilket ger arkitekterna flexibilitet att ta itu med ett större antal användningsfall utan exotiska lösningar.