Vidéo: An Introduction to Multi-model Graph Databases - Part 2: On Polyglot Persistence 2024
Le terme polyglotte est emprunté et redéfini pour le Big Data sous la forme d'un ensemble d'applications utilisant plusieurs technologies de base de données, ce qui est le résultat le plus probable votre planification de la mise en œuvre. La définition officielle de polyglotte est & ldquo; quelqu'un qui parle ou écrit plusieurs langues. & rdquo; Il sera difficile de choisir un style de persistance, quelle que soit l'étroitesse de votre approche du big data.
Une base de données de persistance polyglotte est utilisée lorsqu'il est nécessaire de résoudre un problème complexe en décomposant ce problème en segments et en appliquant différents modèles de base de données. Il est alors nécessaire d'agréger les résultats dans une solution hybride de stockage et d'analyse de données. Un certain nombre de facteurs influent sur cette décision:
-
Vous utilisez déjà la persistance polyglotte dans votre lieu de travail actuel. Si votre entreprise ou votre organisation est importante, vous utilisez probablement plusieurs SGBDR, entrepôts de données, banques de données, fichiers plats, serveurs de gestion de contenu, etc.
Cet environnement hybride est commun et vous devez le comprendre pour pouvoir prendre les bonnes décisions en matière d'intégration, d'analyse, d'actualité des données, de visibilité des données, etc. Vous devez comprendre tout cela parce que vous devez comprendre comment cela va s'intégrer dans votre implémentation de Big Data.
-
L'environnement le plus idéal, où vous n'avez qu'une seule technologie de persistance, n'est probablement pas adapté à la résolution de problèmes de big data. À tout le moins, vous devrez introduire un autre style de base de données et d'autres technologies de support pour votre nouvelle implémentation.
-
En fonction de la variété et de la rapidité de la collecte de données volumineuses, vous devrez peut-être envisager différentes bases de données pour prendre en charge une implémentation. Vous devez également tenir compte de vos exigences en matière d'intégrité transactionnelle. Avez-vous besoin de soutenir la conformité ACID ou la conformité BASE sera-t-elle suffisante?
Supposons que vous ayez besoin d'identifier tous les clients de votre produit qui ont acheté au cours des 12 derniers mois et qui ont commenté les sites Web sociaux sur leur expérience - ET s'ils ont eu des cas de support, où ils ont acquis le produit, comment a été livré, ce qu'ils ont payé, comment ils ont payé, s'ils ont été sur le site Web de l'entreprise, combien de fois, ce qu'ils ont fait, et ainsi de suite.
Supposons ensuite que vous souhaitiez leur offrir une réduction promotionnelle sur leur smartphone lorsqu'ils entrent dans l'un de vos magasins (ou de l'un de vos partenaires).
C'est un grand défi de données à son meilleur.De multiples sources de données avec des structures très différentes doivent être collectées et analysées afin que vous puissiez obtenir les réponses à ces questions. Ensuite, vous devez déterminer si les clients se qualifient pour la promotion et, en temps réel, les pousser un coupon leur offrant quelque chose de nouveau et intéressant.
Ce type de problème ne peut pas être résolu facilement ou de manière rentable avec un type de technologie de base de données. Même si certaines des informations de base sont transactionnelles et probablement dans un SGBDR, les autres informations sont non relationnelles et nécessiteront au moins deux types de moteurs de persistance (spatial et graphique). Vous avez maintenant la persistance polyglotte.