Table des matières:
- Données utiles dans la science des données centrée sur l'entreprise
- Technologies et compétences utiles dans la science des données centrée sur l'entreprise
Vidéo: Des chats meurent pour la science : STOP ou encore ? 2024
Dans l'entreprise, la science des données poursuit le même objectif que la Business Intelligence: convertir données brutes en informations commerciales que les chefs d'entreprise et les gestionnaires peuvent utiliser pour prendre des décisions informées sur les données.
Si vous disposez d'un grand nombre de sources de données structurées et non structurées incomplètes et que vous souhaitez convertir ces sources en informations utiles pour la prise de décision dans l'entreprise, faites appel à un data scientist. La data science centrée sur l'entreprise est multidisciplinaire et intègre les éléments suivants:
-
Analyse quantitative: Peut être sous forme de modélisation mathématique, d'analyse statistique multivariée, de prévision et / ou de simulation.
Le terme multivarié fait référence à plus d'une variable. Une analyse statistique multivariée est une analyse statistique simultanée de plus d'une variable à la fois.
-
Compétences en programmation: Vous avez besoin des compétences de programmation nécessaires pour analyser les données brutes et rendre ces données accessibles aux utilisateurs professionnels.
-
Connaissance de l'entreprise: Vous avez besoin de connaître l'entreprise et son environnement afin de mieux comprendre la pertinence de vos découvertes.
La science des données est une discipline pionnière. Les scientifiques utilisent souvent la méthode scientifique pour l'exploration de données, la formation d'hypothèses et les tests d'hypothèses (par simulation et modélisation statistique). Les data scientists centrés sur les entreprises génèrent des informations précieuses sur les données, souvent en explorant des modèles et des anomalies dans les données métier. La science des données dans un contexte commercial comprend généralement
-
Jeux de données internes et externes: Data science est flexible. Vous pouvez créer assez facilement des mash-ups de données métiers à partir de sources internes et externes de données structurées et non structurées. (A data mash-up est une combinaison de deux ou plusieurs sources de données qui sont ensuite analysées ensemble afin de fournir aux utilisateurs une vue plus complète de la situation actuelle.)
-
Outils, technologies et skillsets: Les exemples pourraient impliquer l'utilisation de plateformes basées sur le cloud, la programmation statistique et mathématique, l'apprentissage automatique, l'analyse de données en Python et R, et la visualisation de données avancée.
Comme les analystes métier, les data-centric data scientists produisent des produits d'aide à la décision à l'usage des chefs d'entreprise et des responsables organisationnels. Ces produits incluent des tableaux de bord d'analyse et des visualisations de données, mais généralement pas des tableaux de données et des tableaux de données.
Données utiles dans la science des données centrée sur l'entreprise
Vous pouvez utiliser la science des données pour extraire des informations commerciales à partir de jeux de données structurées standard (comme BI) ou à partir de jeux structurés, semi-structurés et non structurés. Les données.Les solutions de Data Science ne se limitent pas aux données transactionnelles qui se trouvent dans une base de données relationnelle. vous pouvez utiliser la science des données pour créer des informations précieuses à partir de toutes les sources de données disponibles. Ces sources de données incluent
-
Données commerciales transactionnelles: Source de données éprouvée, les données commerciales transactionnelles sont le type de données structurées utilisées dans la BI traditionnelle et incluent les données de gestion, les données du service client, les données commerciales et marketing, données opérationnelles et données sur le rendement des employés.
-
Données sociales liées à la marque ou à l'entreprise: Phénomène plus récent, les données couvertes par cette rubrique incluent les données non structurées générées par les emails, la messagerie instantanée et les réseaux sociaux tels que Twitter, Facebook, LinkedIn, Pinterest, et Instagram.
-
Données machine issues des opérations commerciales: Les machines génèrent automatiquement ces données non structurées, telles que les données SCADA, les données machine ou les données de capteur.
L'acronyme SCADA fait référence à une acquisition S upervisory C ontrol et D ata A . Les systèmes SCADA sont utilisés pour contrôler les systèmes et équipements mécaniques à distance. Ils génèrent des données qui sont utilisées pour surveiller les opérations des machines et des équipements.
-
Données de fichier audio, vidéo, image et PDF: Ces formats bien établis sont toutes des sources de données non structurées.
Technologies et compétences utiles dans la science des données centrée sur l'entreprise
Les produits de la science des données étant souvent générés à partir de données volumineuses, les solutions de plates-formes de données en nuage sont courantes sur le terrain. Les données utilisées dans la science des données sont souvent dérivées de solutions Big Data basées sur des données, telles que Hadoop, MapReduce et Massively Parallel Processing.
Les data scientists sont des innovateurs, des avant-gardistes qui doivent souvent penser à l'extérieur de la boîte pour trouver des solutions aux problèmes qu'ils résolvent. De nombreux spécialistes des données tendent vers des solutions open source lorsqu'elles sont disponibles. Du point de vue des coûts, cette approche profite aux organisations qui emploient ces scientifiques.
Les data scientists centrés sur les entreprises peuvent utiliser des techniques d'apprentissage automatique pour trouver des modèles (et en tirer des conclusions) d'énormes ensembles de données liés à un secteur d'activité ou à l'entreprise dans son ensemble. Ils sont qualifiés en mathématiques, en statistiques et en programmation, et ils utilisent parfois ces compétences pour générer des modèles prédictifs.
Ils savent généralement programmer en Python ou R. La plupart d'entre eux savent comment utiliser SQL pour interroger des données pertinentes à partir de bases de données structurées. Ils sont généralement compétents pour communiquer des informations sur les données aux utilisateurs finaux - dans le domaine des données centrées sur l'entreprise, les utilisateurs finaux sont des chefs d'entreprise et des responsables organisationnels. Les scientifiques de données doivent être habiles à utiliser des moyens verbaux, oraux et visuels pour communiquer des informations précieuses sur les données.
Bien que les data-centric data scientists jouent un rôle d'aide à la décision dans l'entreprise, ils diffèrent de l'analyste métier en ce qu'ils ont généralement de solides antécédents académiques et professionnels en mathématiques, sciences, ingénierie ou tout ce qui précède. Cela dit, les spécialistes des données centrés sur les affaires ont également une solide connaissance de la gestion d'entreprise.