Inhoudsopgave:
Definitie - Wat betekent SQL op Hadoop?
SQL op Hadoop is een type analytische toepassingstool - de SQL-implementatie op het Hadoop-platform, die standaard SQL-stijl query's van gestructureerde gegevens combineert met het Hadoop-gegevensframework. Hadoop is een relatief nieuw platform, net als big data zelf, en niet veel professionals zijn er experts in, maar SQL op Hadoop vereenvoudigt de toegang tot het Hadoop-framework en maakt het eenvoudiger om te implementeren op huidige bedrijfssystemen.
Techopedia legt SQL uit op Hadoop
SQL op Hadoop verwijst naar verschillende implementaties van SQL voor het Hadoop-platform. MapReduce, dat de clustertaaktoewijzer en resultaatorganisator van Hadoop is, ondersteunt SQL als een belangrijke use-case en andere verwerkingsmethoden. Daarom is het logisch om krachtige tools te maken voor het toestaan van SQL, een van de meest gebruikte talen voor databasequery's en -manipulatie. Naarmate Hadoop aan populariteit wint voor enterprise data-architectuur, is SQL de sleutel voor een goede acceptatie van zowel los gestructureerde gegevens als gestructureerde gegevens die in Hadoop worden gebruikt.
SQL op Hadoop-belangrijkste stuurprogramma's zijn onder meer:
- Gebruikmaken van bestaande SQL-vaardigheden die in de meeste organisaties aanwezig zijn
- Hergebruik van extract transform load (ETL), business intelligence (BI) en analyse-infrastructuurinvesteringen in Hadoop
Sommige SQL over Hadoop-implementaties omvatten:
- Apache Spark SQL
- Apache Hive
- Apache Tajo
- Apache Drill
- HP Vertica op MapR
- ODBC-stuurprogramma's
- Presto
- Haai
