Accueil Finances personnelles Gestion des Big Data Technologies dans un Cloud Hybride - mannequins

Gestion des Big Data Technologies dans un Cloud Hybride - mannequins

Table des matières:

Vidéo: Gestion et stockage des données dans le Big Data vues par NetApp 2025

Vidéo: Gestion et stockage des données dans le Big Data vues par NetApp 2025
Anonim

Le terme big data est souvent utilisé dans le monde de la technologie cloud hybride en raison du besoin permanent de traiter des quantités croissantes de données. L'élément clé du big data est qu'il existe au point de basculement des solutions de contournement que les organisations ont historiquement mises en place pour gérer de gros volumes de données complexes. Les technologies Big Data permettent aux utilisateurs d'analyser et d'utiliser efficacement ces données.

Caractéristiques du Big Data

Le Big Data a généralement trois caractéristiques: le volume, la variété et la vélocité:

  • Volume: Le volume des données volumineuses est important. Il fait généralement référence à au moins plusieurs téraoctets de données. De nombreuses implémentations de Big Data cherchent à analyser des pétaoctets d'informations.

    Nom Valeur
    Octet 10 0
    Gigaoctet 10 9 octets
    Téraoctet 10 12 > octets Pétaoctet
    10 15 octets Exaoctet
    10 18 octets
    Variété:
  • Les données volumineuses sont de différentes formes et tailles. Il inclut ces types de données: Les données structurées

    • sont le type de données typique avec lequel les analystes sont habitués. Il comprend les revenus et le nombre de ventes - le type de données que vous pensez inclure dans une base de données. Des données structurées sont également produites de manière nouvelle dans des produits tels que les capteurs et les étiquettes RFID.

      Les données semi-structurées
    • sont structurées, mais pas de la même façon que les tables d'une base de données. Il comprend les formats EDI et XML. Les données non structurées

    • incluent le texte, l'image et l'audio, y compris tout document, message électronique, tweet ou blog interne à une entreprise ou sur Internet. Les données non structurées représentent environ 80% de toutes les données. Vitesse:

  • C'est la vitesse à laquelle les données se déplacent. Pensez à des capteurs capturant des données toutes les millisecondes ou des flux de données provenant d'équipements médicaux. Les données volumineuses viennent souvent à vous dans un flux, de sorte qu'il est associé à une nature en temps réel. Le cloud est un endroit idéal pour le Big Data en raison de son stockage évolutif, de sa puissance de calcul et de ses ressources élastiques. Le modèle de nuage est à grande échelle; l'informatique distribuée et un certain nombre de cadres et de technologies ont émergé pour soutenir ce modèle, y compris

Apache Hadoop:

  • Une plate-forme informatique distribuée open source écrite en Java. C'est une bibliothèque de logiciels qui permet le traitement distribué entre les clusters d'ordinateurs. C'est vraiment un système de fichiers distribué. Il crée un pool d'ordinateurs, chacun avec un système de fichiers Hadoop. Hadoop a été conçu pour traiter de grandes quantités de données complexes.Les données peuvent être structurées, non structurées ou semi-structurées. Hadoop peut fonctionner sur de nombreux serveurs qui ne partagent pas la mémoire ou le disque. Voir Hadoop pour plus d'informations. MapReduce:

  • Un framework logiciel introduit par Google pour prendre en charge l'informatique répartie sur de grands ensembles de données. C'est au cœur de ce que fait Hadoop avec le big data et l'analyse de Big Data. Il est conçu pour tirer parti des ressources du cloud. Ce calcul est effectué sur de nombreux ordinateurs, appelés clusters , et chaque cluster est appelé nœud . MapReduce peut traiter à la fois des données structurées et non structurées. Les utilisateurs spécifient une fonction de carte qui traite une paire clé / valeur pour générer un ensemble de paires intermédiaires et une fonction de réduction qui fusionne ces paires. Bases de données volumineuses

Hadoop permet de traiter différents types de données. Les systèmes de gestion de bases de données parallèles sont sur le marché depuis des décennies. Ils peuvent prendre en charge l'exécution parallèle car la plupart des tables sont partitionnées sur les nœuds d'un cluster et peuvent traduire les commandes SQL en un plan réparti sur les nœuds du cluster. Cependant, ils traitent principalement des données structurées car il est difficile d'intégrer des données non structurées et libres dans les colonnes et les lignes d'un modèle relationnel.

Hadoop a lancé un mouvement dans ce qui a été appelé

NoSQL, , ce qui ne signifie pas seulement SQL. Le terme fait référence à un ensemble de technologies différentes des systèmes de bases de données relationnelles. Une différence majeure est qu'ils n'utilisent pas SQL. Ils sont également conçus pour les magasins de données distribués. NoSQL ne signifie pas que les gens ne devraient pas utiliser SQL. Au contraire, l'idée est que, en fonction de votre problème, les bases de données relationnelles et les bases de données NoSQL peuvent coexister dans une organisation. Il existe de nombreux exemples de ces types de bases de données, dont les suivantes:

Apache Cassandra:

  • Un système de gestion de données distribué open source développé à l'origine par Facebook. Il n'a aucune exigence de structure stricte, il peut donc gérer tous les types de données. Les experts affirment qu'il excelle dans le traitement des transactions en temps réel à haut volume. D'autres bases de données open source incluent MongoDB, Apache CouchDB et Apache HBase. Amazon Simple DB:

  • Amazon compare cette base de données à une feuille de calcul en ce sens qu'elle contient des colonnes et des lignes contenant des attributs et des éléments stockés dans chaque feuille. Cependant, contrairement à une feuille de calcul, chaque cellule peut avoir plusieurs valeurs et chaque élément peut avoir son propre ensemble d'attributs associés. Amazon puis indexe automatiquement les données. Récemment, Amazon a annoncé Amazon Dynamo DB comme un moyen d'apporter de grandes données NoSQL dans le nuage. Google BigTable:

  • Cet hybride ressemble à une grande table. Étant donné que les tables peuvent être volumineuses, elles sont divisées aux limites des lignes en tables, qui peuvent être des centaines de mégaoctets environ. MapReduce est souvent utilisé pour générer et modifier des données stockées dans BigTable.

Gestion des Big Data Technologies dans un Cloud Hybride - mannequins

Le choix des éditeurs

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Découvrir les Méditations de Pleine Conscience Formelle - les nuls

Pour approfondir votre conscience consciente, vous devez pratiquer une méditation de pleine conscience sur une base quotidienne. Familiarisez-vous avec certaines des médiations suivantes. Avec le temps, vous deviendrez plus conscient de votre vie quotidienne. Body Meditation Meditation - Cette méditation implique de passer environ une demi-heure, en prenant conscience de ...

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Démystifier Dan Brown: Les Templiers Royaux - les nuls

Les Templiers sont presque aussi fictifs dans Dan Brown Le code Da Vinci comme les chevaliers Jedi sont dans Star Wars. Bien que le héros Robert Langdon hésite d'abord à élever les Templiers dans ses cours, parce que la mention même d'eux fait ressortir les amants du complot, Brown n'a aucun problème à les faire participer ...

Démystification des mythes communs sur la franc-maçonnerie - mannequins

Démystification des mythes communs sur la franc-maçonnerie - mannequins

La franc-maçonnerie moderne existe depuis 1717. Les premières contre-vérités concoctées sur l'Ordre sont apparues en impression à peu près en même temps. Les États-Unis étaient consumés par l'hystérie anti-maçonnique à la fin des années 1820, et l'Europe a fait de Mason-bashing un sport populaire pendant deux siècles, le liant souvent à la propagande antisémite. Internet n'a que ...

Le choix des éditeurs

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

À L'aide de la boîte de dialogue Configurer l'affichage dans PowerPoint 2011 pour Mac - témoins

Dans la boîte de dialogue Configurer l'affichage dans PowerPoint, cliquez sur le bouton Configurer l'affichage dans l'onglet Diaporama du ruban Office 2011 pour Mac, ou choisissez Diaporama → Configurer l'affichage dans la barre de menus. Dans les deux cas, la boîte de dialogue Configurer l'affichage polyvalent apparaît. Choisir un type de spectacle dans PowerPoint 2011 pour Mac ...

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement des fichiers dans Office 2011 pour Mac - témoins

Enregistrement d'un fichier sur lequel vous travaillez dans Office 2011 pour Mac est aussi simple que de cliquer sur le bouton Enregistrer dans la barre d'outils Standard, en appuyant sur Commande-S ou en choisissant Fichier → Enregistrer. Si votre fichier a été enregistré précédemment, l'enregistrement du fichier remplace la copie existante du fichier par votre version mise à jour. Si votre fichier n'a pas ...

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Fonctionnant avec les modèles de diapositives maîtres dans PowerPoint 2011 pour Mac - les nuls

Dans Office 2011 pour Mac, l'ajout d'une nouvelle présentation de diapositive à une diapositive dans la vue Diapositive maître de PowerPoint 2011 est une tâche assez simple à effectuer. Suivez ces étapes pour commencer: Assurez-vous que vous êtes en mode Masque des diapositives. Choisissez Affichage → Maître → Masque de diapositives dans la barre de menus. Cliquez sur l'onglet Masque des diapositives du ruban, ...

Le choix des éditeurs

Sélectionnez PowerPoint 2007 Objects - dummies

Sélectionnez PowerPoint 2007 Objects - dummies

Avant de pouvoir modifier un objet PowerPoint 2007 sur une diapositive, vous devez le sélectionner. Dans les présentations PowerPoint, les objets peuvent être du texte, des graphiques, des images clipart, des formes, etc. Voici quelques instructions pour sélectionner les objets PowerPoint 2007: Objets texte: Pour sélectionner un objet texte PowerPoint 2007, déplacez le point d'insertion sur le texte qui ...

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Définir le contour de la forme sur une diapositive PowerPoint 2007 - dummies

Le contrôle shapePoint de powerPoint vous permet style des objets de ligne ou la bordure pour les objets de forme solide sur vos diapositives PowerPoint. Le contrôle Shape Outline se trouve dans le groupe Styles de formes de l'onglet Outils de dessin. Vous pouvez modifier les paramètres suivants pour le contour: Couleur: Définit la couleur utilisée pour ...

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 pour les nuls Cheat Sheet - les nuls

PowerPoint 2016 est le logiciel de présentation le plus puissant disponible pour créer et éditer la diapositive montrer des présentations pour le travail, la maison ou l'école. PowerPoint 2016 offre un certain nombre de raccourcis clavier utiles pour effectuer des tâches rapidement. Voici quelques raccourcis pour le formatage PowerPoint commun, l'édition et les tâches de fichiers et de documents. De plus, après avoir créé votre chef-d'œuvre, vous ...