Vidéo: Panel: Common Challenges In Creating A Data Governance Model And Program 2025
La gouvernance des données est importante pour votre entreprise, quelles que soient vos sources de données volumineuses ou comment elles sont gérées. Dans le monde traditionnel des entrepôts de données ou de la gestion de bases de données relationnelles, il est probable que votre entreprise dispose de règles bien comprises sur la manière dont les données doivent être protégées.
Par exemple, dans le monde de la santé, il est essentiel de garder les données des patients privées. Vous pouvez être en mesure de stocker et d'analyser des données sur les patients tant que les noms, numéros de sécurité sociale et autres données personnelles sont masqués. Vous devez vous assurer que les personnes non autorisées ne peuvent pas accéder aux données privées ou restreintes.
Que se passe-t-il lorsque vous inonder votre environnement de grandes sources de données provenant de diverses sources? Certaines de ces sources proviendront de fournisseurs tiers commerciaux qui ont soigneusement examiné les données et masqué les données sensibles.
Cependant, il est fort probable que les sources de données volumineuses soient non sécurisées et non protégées et incluent beaucoup de données personnelles. Lors du traitement initial de ces données, vous analyserez probablement beaucoup de données qui ne s'avéreront pas pertinentes pour votre organisation. Par conséquent, vous ne souhaitez pas investir de ressources pour protéger et régir les données que vous n'avez pas l'intention de conserver.
Si des données personnelles sensibles transitent sur votre réseau, vous pouvez exposer votre entreprise à des exigences de conformité imprévues. Pour les données réellement exploratoires, avec des contenus inconnus, il peut être plus sûr d'effectuer l'analyse initiale dans un environnement "cloisonné" interne mais segmenté ou dans le cloud.
Enfin, après avoir décidé qu'un sous-ensemble de ces données va être analysé plus profondément afin que les résultats puissent être incorporés dans votre processus métier, il est important de mettre en place un processus d'application rigoureuse des exigences de gouvernance à ces données.
Quels problèmes devez-vous prendre en compte lorsque vous intégrez ces sources non filtrées dans votre environnement? Tenez compte des éléments suivants:
-
Déterminez à l'avance qui est autorisé à accéder aux nouvelles sources de données initialement et après avoir analysé et compris les données.
-
Comprenez comment ces données seront séparées des données d'autres sociétés.
-
Comprenez quelle est votre responsabilité de tirer parti des données. Si les données sont la propriété privée, vous devez vous assurer que vous respectez les contrats ou les règles d'utilisation. Certaines données peuvent être liées à un contrat d'utilisation avec un fournisseur.
-
Comprenez où vos données seront physiquement localisées. Vous pouvez inclure des données liées à des clients ou des prospects dans des pays spécifiques soumis à des exigences de confidentialité strictes.Vous devez être au courant des détails de ces sources pour éviter d'enfreindre les règlements.
-
Comprenez comment vos données doivent être traitées si elles sont physiquement déplacées d'un endroit à un autre. Allez-vous stocker certaines de ces données avec un fournisseur de cloud? Quel type de promesses ce fournisseur offrira-t-il quant à l'endroit où les données seront stockées, et dans quelle mesure elles seront sécurisées?
Le simple fait que vous ayez créé un processus de sécurité et de gouvernance pour vos sources de données traditionnelles ne signifie pas que vous pouvez supposer que les employés et les partenaires étendront ces règles à de nouvelles sources de données. Vous devez prendre en compte deux problèmes clés: la visibilité des données et la confiance de ceux qui travaillent avec les données.
-
Visibilité: Même si les analystes métier et les partenaires avec lesquels vous travaillez peuvent souhaiter utiliser ces nouvelles sources de données, vous ne savez peut-être pas comment ces données seront utilisées et contrôlées. En d'autres termes, vous ne pouvez pas contrôler votre visibilité sur vos ressources qui sont en dehors de votre contrôle.
Cette situation est particulièrement gênante si vous devez vous assurer que votre fournisseur respecte les réglementations ou les lois de conformité. Cela est également vrai lorsque vous utilisez un fournisseur de cloud pour gérer ces données, car le stockage peut être très peu coûteux à gérer.
-
Employés non-évalués: Bien que votre entreprise puisse passer en revue tous ses employés, vous êtes maintenant confiant qu'aucun initié malveillant ne travaille dans différentes unités commerciales en dehors de l'informatique. Vous devez également supposer que votre fournisseur de cloud a diligemment vérifié ses employés.
Cette préoccupation est réelle car près de 50% des violations de sécurité sont causées par des initiés. Si votre entreprise doit utiliser ces nouvelles sources de données de manière très répartie, vous devez disposer d'un plan pour gérer les menaces internes et externes.
Vous avez la responsabilité de vous assurer que vos nouvelles sources de données volumineuses n'ouvrent pas votre entreprise à des menaces imprévues ou à des risques de gouvernance. Il est de votre responsabilité d'avoir une bonne sécurité, des processus de gouvernance et une éducation en place dans l'ensemble de votre environnement de gestion de l'information.
Comme pour tout cycle de vie technologique, vous devez disposer d'un processus d'évaluation de la capacité de votre organisation à répondre à la volonté de tous les mandants de respecter les exigences en matière de sécurité et de gouvernance. Vous avez peut-être déjà mis en place des processus de sécurité des données, de confidentialité et de gouvernance pour vos bases de données structurées et vos entrepôts de données existants. Ces processus doivent être étendus pour votre implémentation Big Data.
