Innehållsförteckning:
Definition - Vad betyder Hadoop Ecosystem?
Hadoop-ekosystemet hänvisar till de olika komponenterna i Apache Hadoop-programvarubiblioteket, liksom tillbehören och verktygen som tillhandahålls av Apache Software Foundation för dessa typer av programvaruprojekt, och till de sätt som de arbetar tillsammans.
Hadoop är ett Java-baserat ramverk som är extremt populärt för hantering och analys av stora datamängder.
Techopedia förklarar Hadoop Ecosystem
Både Hadoop-paketet och dess tillbehör är mestadels öppna källkodsprojekt licensierade av Apache. Idén med ett Hadoop-ekosystem innebär användning av olika delar av Hadoop-kärnuppsättningen, som MapReduce, ett ramverk för att hantera stora mängder data, och Hadoop Distribuerat filsystem (HDFS), ett sofistikerat filhanteringssystem. Det finns också YARN, en Hadoop resurschef.
Förutom dessa kärnelement i Hadoop, har Apache också levererat andra typer av tillbehör eller kompletterande verktyg för utvecklare. Dessa inkluderar Apache Hive, ett dataanalysverktyg; Apache Spark, en allmän motor för behandling av big data; Apache Pig, ett dataflödesspråk; HBase, ett databasverktyg; och även Ambarl, som kan betraktas som en Hadoop-ekosystemhanterare, eftersom det hjälper till att administrera användningen av dessa olika Apache-resurser tillsammans. Eftersom Hadoop blev de facto-standarden för datainsamling och blir allestädes närvarande i många organisationer, lär chefer och utvecklingsledare allt om Hadoop-ekosystemet och vilka slags saker som är involverade i en allmän Hadoop-installation.




