Vidéo: Comment utiliser le composant Hadoop de Stambia pour gérer vos projets Big Data 2024
Il y a des raisons impérieuses pour lesquelles SQL s'est montré résilient. L'industrie informatique a 40 ans d'expérience avec SQL, depuis sa création par IBM au début des années 1970. Avec l'augmentation de l'adoption des bases de données relationnelles dans les années 1980, SQL est devenu une compétence standard pour la plupart des professionnels de l'informatique.
Vous pouvez facilement voir pourquoi SQL a été un tel succès: il est relativement facile à apprendre, et les requêtes SQL sont très lisibles. Cette facilité peut être retracée à un point de conception de base dans SQL - le fait que c'est un langage déclaratif , par opposition à un langage impératif .
Pour qu'une langue soit déclarative, cela signifie que vos requêtes ne traitent que de la nature des données demandées - idéalement, votre requête ne devrait contenir aucun élément qui détermine comment le traitement devrait être exécuté. En d'autres termes, tout ce que vous indiquez en SQL est ce que vous voulez obtenir du système - et non comment l'obtenir.
En revanche, avec un langage impératif (C, par exemple, ou Java, ou Python), votre code consiste en des instructions où vous définissez les actions que le système doit exécuter.
En plus des compétences (facilement exploitables) de vos professionnels de l'informatique conviviaux pour SQL, des applications de bases de données datant de plusieurs décennies ont également été construites avec des interfaces SQL. Lorsqu'on parle de la façon dont Hadoop peut compléter l'entrepôt de données, il est clair que les organisations stockent des données structurées dans Hadoop. Et par conséquent, ils vont exécuter une partie de leur logique applicative existante contre Hadoop.
Personne ne veut payer pour que les applications soient réécrites, donc une interface SQL est hautement souhaitable.
Avec le développement d'interfaces SQL vers les données Hadoop, une tendance intéressante est que les outils d'analyse commerciale et de gestion des données commerciales sautent presque tous sur le système Hadoop, notamment les rapports de veille stratégique; paquets statistiques; Extraire, transformer et charger des structures (ETL); et une variété d'autres outils. Dans la plupart des cas, l'interface avec les données Hadoop est Hive.