Vidéo: ? DOCUMENTAL - EL DESASTRE DEL PRESTIGE -DOCUMENTALES NATIONAL GEOGRAPHIC COMPLETO,documental 2016 2025
Au cœur de tout environnement big data, et couche 2 de la grande pile de données, se trouvent les moteurs de base de données contenant collections d'éléments de données pertinentes pour votre entreprise. Ces moteurs doivent être rapides, évolutifs et solides. Ils ne sont pas tous créés égaux, et certains grands environnements de données seront mieux avec un moteur qu'un autre, ou plus probablement avec un mélange de moteurs de base de données.
Par exemple, bien qu'il soit possible d'utiliser des systèmes de gestion de bases de données relationnelles (RDBMS) pour toutes vos implémentations de Big Data, il n'est pas pratique de le faire en raison des performances, de l'échelle ou même du coût. Un certain nombre de technologies de base de données différentes sont disponibles, et vous devez prendre soin de choisir judicieusement.
Il n'existe pas de choix unique en ce qui concerne les langues de base de données. Bien que SQL soit le langage de requête de base de données le plus utilisé aujourd'hui, d'autres langues peuvent constituer un moyen plus efficace de résoudre vos problèmes de big data. Il est utile de considérer les moteurs et les langages comme des outils dans une «boîte à outils d'implémentation». "Votre travail consiste à choisir le bon outil.
Par exemple, si vous utilisez un modèle relationnel, vous utiliserez probablement SQL pour l'interroger. Cependant, vous pouvez également utiliser d'autres langages comme Python ou Java. Il est très important de comprendre quels types de données peuvent être manipulés par la base de données et si elle supporte un vrai comportement transactionnel. Les concepteurs de bases de données décrivent ce comportement avec l'acronyme ACID. Cela signifie
-
Atomicité: Une transaction est "tout ou rien" quand elle est atomique. Si une partie de la transaction ou le système sous-jacent tombe en panne, la transaction entière échoue.
-
Cohérence: Seules les transactions avec des données valides seront effectuées sur la base de données. Si les données sont corrompues ou incorrectes, la transaction ne sera pas terminée et les données ne seront pas écrites dans la base de données.
-
Isolement: Les transactions multiples et simultanées n'interfèrent pas entre elles. Toutes les transactions valides seront exécutées jusqu'à leur achèvement et dans l'ordre où elles ont été soumises pour traitement.
-
Durabilité: Une fois que les données de la transaction ont été écrites dans la base de données, elles restent "pour toujours". "
Moteur Langage de requête MapReduce Types de données Transactions Exemples Relationnel SQL, Python, C Non Type ACID PostgreSQL, Oracle, DB / 2 Columnar Ruby Hadoop Prédéfini et typé Oui, si activé HBase Graphique Marcher, Rechercher, Chiffre Non Non typé ACID Neo4J Document Commandes JavaScript Dactylographié Non MongoDB, CouchDB Valeur-clé Lucene, Commandes JavaScript BLOB, semityped Non Riak, Redis
Après avoir compris vos besoins et compris les données que vous rassemblez, où les mettre, et Pour ce faire, vous devez l'organiser afin qu'il puisse être utilisé pour les analyses, les rapports ou les applications spécifiques.