Table des matières:
- Data science and l'ingénierie des données ne sont pas les mêmes
- La data science et la business intelligence ne sont pas les mêmes
Vidéo: Faut-il être bon en maths pour réussir ses investissements ? 2024
Fait partie de Data Science For Dummies
Traditionnellement, données volumineuses désigne les données qui ont un volume, une vélocité et une variété incroyables. Les technologies de base de données traditionnelles ne sont pas capables de gérer les mégadonnées - des solutions plus innovantes basées sur les données sont nécessaires. Pour évaluer votre projet pour savoir s'il est considéré comme un projet Big Data, tenez compte des critères suivants:
-
Volume: Entre 1 téraoctets / an et 10 pétaoctets / an
-
Vitesse: Entre 30 kilooctets / seconde et 30 gigaoctets / seconde
-
Variété: Sources combinées de données non structurées, semi-structurées et structurées
Data science and l'ingénierie des données ne sont pas les mêmes
Les gestionnaires d'embauche ont tendance à confondre les rôles de data scientist et de data engineer. Alors qu'il est possible de trouver quelqu'un qui fait un peu des deux, chaque domaine est incroyablement complexe. Il est peu probable que vous trouviez quelqu'un avec de solides compétences et de l'expérience dans les deux domaines. Pour cette raison, il est important d'être en mesure d'identifier quel type de spécialiste est le plus approprié pour vous aider à atteindre vos objectifs spécifiques. Les descriptions ci-dessous devraient vous aider à le faire.
-
Data scientists: Les data scientists utilisent le codage, les méthodes quantitatives (mathématiques, statistiques et machine learning) et une expertise hautement spécialisée dans leur domaine d'étude pour trouver des solutions à des problèmes scientifiques et commerciaux complexes.
-
Ingénieurs de données: Les ingénieurs de données utilisent leurs compétences en informatique et en génie logiciel pour concevoir des systèmes et résoudre des problèmes liés à la manipulation et à la manipulation de grands ensembles de données.
La data science et la business intelligence ne sont pas les mêmes
Les data scientists et business analyst centrés sur l'entreprise qui font de la business intelligence sont comme des cousins. Les deux types de spécialistes utilisent les données pour atteindre les mêmes objectifs commerciaux, mais leurs approches, technologies et fonctions sont différentes. Les descriptions ci-dessous expliquent les différences entre les deux rôles.
-
Business intelligence (BI): Les solutions de BI sont généralement construites à partir de jeux de données générés en interne - à l'intérieur d'une organisation plutôt que de l'extérieur, en d'autres termes. Les outils et technologies courants incluent le traitement analytique en ligne, la transformation et la charge des extractions, et l'entreposage de données. Bien que la BI implique parfois des méthodes prospectives comme la prévision, ces méthodes sont basées sur de simples inférences mathématiques à partir de données historiques ou actuelles.
-
Science des données centrée sur l'entreprise: Les solutions de science des données centrées sur l'entreprise sont élaborées à partir de jeux de données internes et externes à une organisation. Les outils, les technologies et les compétences communs incluent les plateformes d'analyse basées sur le cloud, la programmation statistique et mathématique, l'apprentissage automatique, l'analyse de données à l'aide de Python et de R, et la visualisation avancée des données. Les data-centric data scientists utilisent des méthodes mathématiques ou statistiques avancées pour analyser et générer des prédictions à partir de vastes quantités de données métier.