Hem Trends Vad är apache avro? - definition från techopedia

Vad är apache avro? - definition från techopedia

Innehållsförteckning:

Anonim

Definition - Vad betyder Apache Avro?

Apache Avro är en dataserialiserings- och fjärrproceduranropsram som utvecklas inom Apache Hadoop-projektet, där det tillhandahåller både ett serialiseringsformat för att få ihållande data och ett trådformat för att tillhandahålla kommunikation mellan Hadoop-noder, samt ansluta klientprogram till Hadoop tjänster.

Avro använder JSON-formatet för att definiera protokoll och datatyper, samt serielliserar data till ett kompakt binärt format.

Techopedia förklarar Apache Avro

Apache Avro är ett stort dataserialiseringsram som producerar data i ett kompakt binärt format som inte kräver kodgenerering eller proxyobjekt.

Det används som dataserialiseringskomponent för Apache Hadoop. Avro arbetar med begreppet scheman. När Avro-data läses är schemat som användes under skrivningen av den specifika datan alltid närvarande.

Detta tillåter varje datauppsättning utan överkostnader per värde, vilket gör att serien är både snabb och relativt liten i storlek. Och eftersom data och deras schema är helt självbeskrivande, gör det det enkelt att använda med dynamiska skriptspråk.

När Avro-data lagras i en specifik fil, lagras schemat också med dem för att senare behandlas av ett annat program. Så om ett program som läser data förväntar sig ett annat schema, kan det lätt lösas eftersom båda scheman finns.

Avro tillhandahåller:

    Ett kompakt och snabbt binärt dataformat

    Rika datastrukturer

    En containerfil för lagring av ihållande data

    Fjärrprocedursamtal (RPC)

    Integration med dynamiska språk

Generering av kod är inte ett krav för att läsa eller skriva datafiler eller använda eller implementera RPC-protokoll.

Vad är apache avro? - definition från techopedia