Vidéo: Introduction to the HP Business Data Warehouse Appliance 2024
Comme pour les jeans à cloche, les bases de données matérielles sont sur la voie du retour. Microsoft, Oracle et Netezza font fureur dans les séminaires sur les bases de données à travers le monde. Au milieu des années 1980, les vendeurs Britton Lee et Teradata (qui ont finalement fusionné) faisaient fureur.
Ils ont fourni des machines dédiées qui optimisaient le traitement des bases de données - les premières machines utilisées par les gros consommateurs de données, y compris de nombreuses entreprises de biens de consommation.
L'objectif de ces boîtes était de consacrer tous les aspects d'un ordinateur à la transmission plus rapide des données aux utilisateurs. Cette machine dédiée comprenait une base de données centrée sur la requête, la mémoire, le processeur et les opérations sur le disque. Finalement, de tels produits sont sortis de la mode, et les systèmes de gestion de bases de données ont été migrés vers une architecture plus ouverte, fonctionnant sur n'importe quelle case.
Maintenant, ils sont de retour!
Un appliance d'entrepôt de données est un ensemble intégré de serveurs, de stockage, de système d'exploitation, de SGBD et de logiciels spécifiquement pré-installés et pré-optimisés pour l'entreposage de données. Les appliances d'entrepôt de données fournissent des solutions pour le marché des entrepôts de données de volume moyen à élevé, offrant des performances à faible coût sur des volumes de données allant de téraoctet à pétaoctet (c'est beaucoup de données!).
La plupart des fournisseurs d'appliances d'entrepôt de données utilisent des architectures de traitement massivement parallèle (MPP) pour fournir des performances de requête élevées et une évolutivité de plate-forme. Les architectures MPP sont constituées de processeurs indépendants ou de serveurs s'exécutant en parallèle.
La plupart des architectures MPP implémentent une architecture sans partage , dans laquelle chaque serveur est autonome et contrôle sa propre mémoire et son propre disque. Les architectures sans partage ont un dossier prouvé pour l'évolutivité élevée et le peu de contention.
La plupart des appliances d'entrepôt de données distribuent des données sur des unités de stockage sur disque dédiées connectées à chaque serveur de l'appliance. Cette distribution permet aux appliances de résoudre une requête relationnelle en analysant les données sur chaque serveur en parallèle. L'approche Divide-and-Conquer offre des performances élevées et évolue linéairement lorsque vous ajoutez de nouveaux serveurs dans l'architecture.
Et, du point de vue des prix, la plupart des fournisseurs dans ce domaine tentent une stratégie de plug-and-play. Par exemple, Netezza vend généralement à un nouvel utilisateur son produit comme compatible avec Teradata à un prix inférieur au coût de maintenance de Teradata. Ce prix rend les produits très attractifs, ce qui leur donne un taux d'adoption croissant.