Huis trends Wat is Apache Spark? - definitie van techopedia

Wat is Apache Spark? - definitie van techopedia

Inhoudsopgave:

Anonim

Definitie - Wat betekent Apache Spark?

Apache Spark is een open-sourceprogramma dat wordt gebruikt voor data-analyse. Het maakt deel uit van een groter pakket hulpmiddelen, waaronder Apache Hadoop en andere open-sourcebronnen voor de hedendaagse analysecommunity.

Experts beschrijven deze relatief nieuwe open-source software als een data-analyse cluster computing tool. Het kan worden gebruikt met het Hadoop Distributed File System (HDFS), een bepaalde Hadoop-component die gecompliceerde bestandsverwerking mogelijk maakt.

Sommige IT-professionals beschrijven het gebruik van Apache Spark als een potentiële vervanging voor de component Apache Hadoop MapReduce. MapReduce is ook een clusteringstool waarmee ontwikkelaars grote hoeveelheden gegevens kunnen verwerken. Degenen die het ontwerp van Apache Spark begrijpen, wijzen erop dat het in sommige situaties vele malen sneller kan zijn dan MapReduce.

Techopedia legt Apache Spark uit

Uit rapporten over het moderne gebruik van Apache Spark blijkt dat bedrijven het op verschillende manieren gebruiken. Een veelgebruikt gebruik is het verzamelen en structureren van gegevens op meer verfijnde manieren. Apache Spark kan ook nuttig zijn bij het machine-learningwerk van analyses of gegevensclassificatie.

Normaal gesproken staan ​​organisaties voor de uitdaging om gegevens op een efficiënte en enigszins geautomatiseerde manier te verfijnen, waarbij Apache Spark kan worden gebruikt voor dit soort taken. Sommigen impliceren ook dat het gebruik van Spark kan helpen toegang te geven tot degenen die minder kennis hebben van programmeren en betrokken willen worden bij de verwerking van analyses.

Apache Spark bevat API's voor Python en gerelateerde softwaretalen.

Wat is Apache Spark? - definitie van techopedia