Huis audio Hoe kan sql op hadoop helpen met big data-analyse?

Hoe kan sql op hadoop helpen met big data-analyse?

Inhoudsopgave:

Anonim

SQL op Hadoop is een groep van analytische toepassingstools die query's en gegevensverwerking in SQL-stijl combineert met de meest recente Hadoop-datakaderelementen. De opkomst van SQL op Hadoop is een belangrijke ontwikkeling voor de verwerking van big data, omdat hierdoor grotere groepen mensen met succes kunnen werken met het Hadoop-kader voor gegevensverwerking door SQL-query's uit te voeren op de enorme hoeveelheden big data die Hadoop verwerkt. Het was duidelijk dat het Hadoop-framework voorheen niet zo toegankelijk was voor mensen, vooral wat betreft de vraagmogelijkheden. Op basis van de ontwikkeling zijn verschillende tools in de maak die beloven de productiviteit van ondernemingen te verbeteren als het gaat om het verwerken en analyseren van big data met kwaliteit en snelheid. Het is ook niet nodig om veel te investeren in het leren van de tool, zoals traditionele kennis van SQL zou moeten doen.

Definitie van SQL op Hadoop

SQL op Hadoop is een groep applicaties waarmee u SQL-stijlquery's kunt uitvoeren op big data die worden gehost door het Hadoop-gegevensverwerkingsraamwerk. Het is duidelijk dat het opvragen, ophalen en analyseren van gegevens eenvoudiger is geworden met de toevoeging van SQL op Hadoop. Aangezien SQL oorspronkelijk werd ontworpen voor relationele databases, moest het worden aangepast volgens het Hadoop 1-model dat MapReduce en het Hadoop Distributed File System (HDFS) omvat, en het Hadoop 2-model zonder MapReduce en HDFS.

Een van de eerste pogingen om SQL met Hadoop te combineren, resulteerde in de oprichting van het Hive datawarehouse met de HiveQL-software die SQL-achtige zoekopdrachten kon vertalen in MapReduce-taken. Daarna werden verschillende applicaties ontwikkeld die soortgelijke taken konden uitvoeren. Prominent onder de latere tools zijn Drill, BigSQL, HAWQ, Impala, Hadapt, Stinger, H-SQL, Splice Machine, Presto, PolyBase, Spark, JethroData, Shark (Hive on Spark) en Tez (Hive on Tez).

Hoe kan sql op hadoop helpen met big data-analyse?