Vidéo: La Gouvernance des Données : plus important que le Chief Data Officer ? 2025
Le big data est-il vraiment nouveau ou est-il une évolution dans la gestion des données? C'est en fait les deux. Comme pour les autres vagues de gestion des données, les mégadonnées reposent sur l'évolution des pratiques de gestion des données au cours des cinq dernières décennies. Ce qui est nouveau, c'est que pour la première fois, le coût des cycles de calcul et de stockage a atteint un point critique. Pourquoi est-ce important?
Il y a seulement quelques années, les entreprises faisaient généralement des compromis en stockant des instantanés ou des sous-ensembles d'informations importantes parce que le coût de stockage et les limites de traitement les empêchaient de stocker tout ce qu'ils voulaient analyser.
Dans de nombreuses situations, ce compromis a bien fonctionné. Par exemple, une entreprise de fabrication peut avoir collecté des données machine toutes les deux minutes pour déterminer la santé des systèmes. Cependant, il pourrait y avoir des situations où l'instantané ne contiendrait pas d'informations sur un nouveau type de défaut et cela pourrait passer inaperçu pendant des mois.
Avec le Big Data, il est désormais possible de virtualiser les données afin qu'elles puissent être stockées efficacement et, en utilisant le stockage en nuage, de manière plus rentable. En outre, les améliorations de la vitesse et de la fiabilité du réseau ont éliminé d'autres limites physiques liées à la capacité de gérer des quantités massives de données à un rythme acceptable.
Ajoutez à cela l'impact des changements dans le prix et la sophistication de la mémoire de l'ordinateur. Avec toutes ces transitions technologiques, il est maintenant possible d'imaginer des façons dont les entreprises peuvent exploiter des données qui auraient été inconcevables il y a seulement cinq ans.
Mais aucune transition technologique ne se produit isolément. cela se produit lorsqu'il existe un besoin important qui peut être satisfait par la disponibilité et la maturation de la technologie. La plupart des technologies au cœur du Big Data, telles que la virtualisation, le traitement parallèle, les systèmes de fichiers distribués et les bases de données en mémoire, existent depuis des décennies.
Les analyses avancées existent depuis des décennies, même si elles n'ont pas toujours été pratiques. D'autres technologies telles que Hadoop et MapReduce sont sur la scène depuis seulement quelques années. Cette combinaison de progrès technologiques peut maintenant résoudre des problèmes commerciaux importants. Les entreprises veulent être en mesure d'obtenir des informations et des résultats exploitables à partir de différents types de données à la bonne vitesse.
Si les entreprises peuvent analyser des pétaoctets de données (équivalant à 20 millions de classeurs à quatre tiroirs remplis de fichiers texte ou à 13 ans de contenu HDTV) avec des performances acceptables pour discerner les modèles et les anomalies, les entreprises peuvent commencer à comprendre de nouvelles façons.Le passage au big data ne concerne pas seulement les entreprises.
La science, la recherche et les activités gouvernementales ont également contribué à faire avancer les choses. Pensez simplement à l'analyse du génome humain ou au traitement de toutes les données astronomiques recueillies dans les observatoires pour faire progresser notre compréhension du monde qui nous entoure. Considérez la quantité de données que le gouvernement recueille également dans ses activités antiterroristes, et vous avez l'idée que les données volumineuses ne concernent pas seulement les affaires.
Différentes approches de traitement des données existent. Les données en mouvement seraient utilisées si une entreprise est capable d'analyser la qualité de ses produits pendant le processus de fabrication pour éviter des erreurs coûteuses. Les données au repos seraient utilisées par un analyste commercial pour mieux comprendre les habitudes d'achat actuelles des clients en fonction de tous les aspects de la relation client, y compris les ventes, les données sur les médias sociaux et les interactions avec le service client.
Gardez à l'esprit que les entreprises sont encore à un stade précoce de l'exploitation d'énormes volumes de données pour obtenir une vue à 360 degrés de l'entreprise et anticiper les changements et les changements dans les attentes des clients. Les technologies nécessaires pour obtenir les réponses aux besoins de l'entreprise sont toujours isolées les unes des autres.
Les données volumineuses ne sont pas simplement un outil ou une technologie. Il s'agit de savoir comment toutes ces technologies se combinent pour donner les bonnes idées, au bon moment, en fonction des bonnes données - qu'elles soient générées par des personnes, des machines ou le Web.