Table des matières:
Définition - Que signifie SQL sur Hadoop?
SQL sur Hadoop est un type d'outil d'application analytique - l'implémentation SQL sur la plate-forme Hadoop, qui combine l'interrogation de style SQL standard de données structurées avec l'infrastructure de données Hadoop. Hadoop est une plate-forme relativement nouvelle, tout comme les mégadonnées elles-mêmes, et peu de professionnels en sont experts, mais SQL sur Hadoop simplifie l'accès au cadre Hadoop et le rend plus facile à implémenter sur les systèmes d'entreprise actuels.
Techopedia explique SQL sur Hadoop
SQL sur Hadoop fait référence à diverses implémentations de SQL pour la plate-forme Hadoop. MapReduce, qui est le mappeur de travaux de cluster et l'organisateur de résultats de Hadoop, prend en charge SQL comme cas d'utilisation majeur ainsi que d'autres méthodes de traitement. Par conséquent, il est logique de créer des outils puissants pour autoriser SQL, qui est l'un des langages les plus utilisés pour la requête et la manipulation de bases de données. Alors que Hadoop gagne en popularité pour l'architecture de données d'entreprise, SQL est essentiel pour une adoption appropriée à la fois pour les données faiblement structurées et les données structurées utilisées dans Hadoop.
Les pilotes de clé SQL sur Hadoop incluent:
- Tirer parti des compétences SQL existantes dans la plupart des organisations
- Réutilisation des charges d'extraction de transformation (ETL), de business intelligence (BI) et d'infrastructure d'analyse dans Hadoop
Certaines implémentations SQL sur Hadoop incluent:
- Apache Spark SQL
- Apache Hive
- Apache Tajo
- Apache Drill
- HP Vertica sur MapR
- Pilotes ODBC
- Presto
- Requin
