Vidéo: La révélation des Pyramides - Le film en français 2024
Alors, quand devriez-vous envisager d'utiliser HBase? Bien que la réponse à cette question ne soit pas forcément simple pour tout le monde, pour commencer, vous devez clairement avoir un gros besoin de données et des ressources matérielles suffisantes.
-
Un gros volume de données: Téraoctets en pétaoctets, sinon vous aurez beaucoup de serveurs inactifs dans vos racks.
-
Ressources matérielles suffisantes: Cinq serveurs constituent un bon point de départ.
En considérant la route à emprunter - HBase versus SGBDR - tenez compte d'autres exigences telles que le support des transactions, les types de données, les index et la prise en charge du langage de requête - bien que ces facteurs ne soient pas aussi précédant deux balles. Les types de données, les index et le support de langage de requête peuvent être ajoutés via d'autres technologies, telles que Hive ou des produits commerciaux.
"Qu'en est-il des transactions? " tu demandes.
Certains cas d'utilisation des SGBDR, comme le traitement des transactions en ligne, dépendent des transactions conformes à l'ACID entre le client et le SGBDR pour que le système fonctionne correctement. (ACID - A oncologie, C , I solitude et D urabilité)
Comparé à un SGBDR, HBase n'est pas considéré comme une base de données ACID-conforme à cette écriture. HBase ne prend pas en charge les transactions compatibles ACID sur plusieurs lignes ou entre tables. Cependant, HBase garantit les aspects suivants:
-
Atomique: Toutes les opérations de niveau ligne d'une table sont atomiques. Cette garantie est maintenue même s'il y a plus d'une famille de colonnes dans une rangée.
-
Cohérence: Les opérations d'analyse renvoient une vue cohérente des données stockées dans HBase à un moment donné dans le passé. L'interaction client simultanée peut mettre à jour une ligne au cours d'une analyse sur plusieurs lignes, mais toutes les lignes renvoyées par une opération d'analyse contiennent toujours des données valides à un moment donné dans le passé.
-
Durabilité: Toutes les données pouvant être récupérées à partir de HBase ont également été rendues durables sur le disque (en d'autres termes, elles ont persisté dans HDFS).
L'un des aspects passionnants de HBase et d'autres projets Apache open source est que quelqu'un dans la communauté innove toujours et essaie d'améliorer la technologie. HBase prend en charge les transactions à plusieurs lignes si les lignes sont sur le même RegionServer. Cette fonctionnalité, qui nécessite un codage supplémentaire, a été introduite dans HBase version 0. 94. 0. (Si vous êtes curieux, le codage supplémentaire a porté sur la politique de partage de HBase.)
Lorsque les clients de HBase ont besoin de propriétés ACID, concevez le Schéma HBase tel que des opérations de données croisées ou croisées ne sont pas nécessaires.Garder les données dans une rangée fournit l'atomicité.