Huis databases Wat is het Hadoop distributed file system (hdfs)? - definitie van techopedia

Wat is het Hadoop distributed file system (hdfs)? - definitie van techopedia

Inhoudsopgave:

Anonim

Definitie - Wat betekent Hadoop Distributed File System (HDFS)?

Het Hadoop Distributed File System (HDFS) is een gedistribueerd bestandssysteem dat op standaard- of low-end hardware draait. HDFS is ontwikkeld door Apache Hadoop en werkt als een standaard gedistribueerd bestandssysteem, maar biedt een betere gegevensdoorvoer en toegang via het MapReduce-algoritme, hoge fouttolerantie en native ondersteuning van grote gegevenssets.

Techopedia verklaart Hadoop Distributed File System (HDFS)

De HDFS slaat een grote hoeveelheid gegevens op die op meerdere machines zijn geplaatst, meestal in honderden en duizenden gelijktijdig verbonden knooppunten, en biedt gegevensbetrouwbaarheid door elke gegevensinstantie te repliceren als drie verschillende kopieën - twee in één groep en één in een andere. Deze kopieën kunnen worden vervangen in geval van storing.

De HDFS-architectuur bestaat uit clusters, die elk toegankelijk zijn via een enkele NameNode-softwaretool die op een afzonderlijke machine is geïnstalleerd om het bestandssysteem en het gebruikerstoegangsmechanisme van dat cluster te bewaken en te beheren. De andere machines installeren één exemplaar van DataNode om clusteropslag te beheren.

Omdat HDFS in Java is geschreven, biedt het native ondersteuning voor Java Application Programming Interfaces (API) voor applicatie-integratie en toegankelijkheid. Het is ook toegankelijk via standaard webbrowsers.

Wat is het Hadoop distributed file system (hdfs)? - definitie van techopedia