Vidéo: Big Data : comprendre le présent pour prédire l'avenir 2024
Partie du Big Data pour les petites et moyennes entreprises Cheat Sheet
Le jargon technique entourant les big data peut sembler un peu intimidant au premier abord. Les phrases clés et les termes que vous êtes susceptible de rencontrer, avec des définitions faciles à comprendre pour chacun, suivent:
-
Big data: De plus en plus, tout ce que vous faites laisse une trace numérique (ou données), que vous (et d'autres) peuvent utiliser et analyser. L'expression données volumineuses fait référence à la collecte de données et à la possibilité d'en faire usage.
-
Analyse des données volumineuses: Il s'agit du processus de collecte, de traitement et d'analyse des données afin de générer des informations qui éclairent la prise de décision basée sur les faits. Dans de nombreux cas, il s'agit d'une analyse logicielle utilisant des algorithmes.
-
Algorithme: Formule mathématique ou processus statistique exécuté par logiciel pour analyser les données. Il implique généralement plusieurs étapes de calcul et peut être utilisé pour traiter automatiquement des données ou résoudre des problèmes.
-
Cloud computing: Logiciels ou données s'exécutant sur des serveurs distants plutôt que localement. Ainsi, au lieu de stocker ou de calculer des choses sur votre propre machine, vous pouvez utiliser d'autres ordinateurs connectés à votre ordinateur via un réseau (tel qu'Internet).
-
Données structurées: Toutes les données ou informations situées dans un champ fixe dans un enregistrement ou un fichier défini, tel qu'une base de données ou une feuille de calcul. Sa structure inhérente le rend rapide, facile et bon marché à analyser.
-
Données non structurées: Toutes les données ne sont pas facilement stockées et indexées dans des formats ou des bases de données traditionnels. Cela inclut les conversations par e-mail, les publications sur les réseaux sociaux, le contenu vidéo, les photos, les enregistrements vocaux, les sons, etc. Son manque de structure rend plus difficile l'analyse en utilisant des programmes informatiques traditionnels.
-
Données semi-structurées: Vous l'avez deviné, il s'agit d'un croisement entre des données structurées et non structurées. Ce sont des données qui peuvent avoir une structure qui peut être utilisée pour l'analyse mais qui n'a pas la structure stricte trouvée dans les bases de données ou les tableurs. Par exemple, un post Facebook peut être catégorisé par auteur, date, longueur et même sentiment, mais le contenu n'est généralement pas structuré.
-
Données internes: Ceci représente toutes les données que votre entreprise a ou pourrait potentiellement avoir accès ou générer dans le futur. Il pourrait être structuré en format (par exemple, une base de données client) ou pourrait être non structuré (données conversationnelles provenant d'appels de service client).
-
Données externes: En termes simples, il s'agit de l'ensemble infini d'informations qui existent en dehors de votre entreprise. Il peut être publiquement disponible ou privé et il peut également être structuré ou non structuré dans le format.
-
L'Internet des objets: Un réseau qui connecte les appareils (les objets mentionnés dans le nom) afin qu'ils puissent communiquer entre eux. Cela englobe la technologie comme les téléviseurs intelligents, les téléphones intelligents et les capteurs, et tout cela est possible grâce à l'augmentation massive de la connectivité entre les appareils, les systèmes et les services.