Table des matières:
- Interfaces et flux de données volumineuses
- Infrastructure physique de données volumineuses redondante
- Infrastructure de sécurité Big Data
- Sources de données volumineuses opérationnelles
Vidéo: Oculus Quest Basics Tutorial 2024
Il est important de jeter une base architecturale solide si vous voulez avoir du succès avec le big data. En plus de soutenir les exigences fonctionnelles, il est important de soutenir la performance requise. Vos besoins dépendront de la nature de l'analyse que vous soutenez. Vous aurez besoin de la bonne quantité de puissance et de vitesse de calcul.
Votre architecture doit également avoir la bonne quantité de redondance pour vous protéger des temps d'attente et des temps d'arrêt imprévus.
Commencez par vous poser les questions suivantes:
-
De combien de données votre organisation aura-t-elle besoin pour gérer aujourd'hui et à l'avenir?
-
À quelle fréquence votre organisation doit-elle gérer les données en temps réel ou en temps quasi réel?
-
Quel risque votre organisation peut-elle assumer? Votre industrie est-elle assujettie à des exigences strictes en matière de sécurité, de conformité et de gouvernance?
-
Quelle est l'importance de la vitesse pour votre besoin de gérer les données?
-
Dans quelle mesure les données doivent-elles être précises ou précises?
Interfaces et flux de données volumineuses
Pour comprendre le fonctionnement du big data dans le monde réel, il est important de commencer par comprendre la nécessité des interfaces et des flux. En fait, ce qui rend les gros volumes de données importants, c'est le fait qu'ils dépendent de la collecte de nombreuses données provenant de nombreuses sources.
Par conséquent, les interfaces de programmation d'applications (API) ouvertes seront au cœur de toute architecture de Big Data. En outre, gardez à l'esprit que les interfaces existent à chaque niveau et entre chaque couche de la pile. Sans services d'intégration, le big data ne peut pas arriver.
Infrastructure physique de données volumineuses redondante
L'infrastructure physique de support est fondamentale pour le fonctionnement et l'évolutivité d'une architecture de Big Data. En fait, sans la disponibilité d'infrastructures physiques robustes, les grandes données n'auraient probablement pas émergé comme une tendance si importante. Pour supporter un volume de données imprévu ou imprévu, une infrastructure physique pour les données volumineuses doit être différente de celle des données traditionnelles.
L'infrastructure physique est basée sur un modèle de calcul distribué. Cela signifie que les données peuvent être stockées physiquement dans de nombreux endroits différents et peuvent être reliées entre elles par des réseaux, l'utilisation d'un système de fichiers distribué et divers outils et applications d'analyse de Big Data.
La redondance est importante parce que vous avez affaire à autant de données provenant de sources aussi variées. La redondance prend plusieurs formes. Si votre entreprise a créé un cloud privé, vous souhaiterez que la redondance soit intégrée à l'environnement privé afin qu'elle puisse évoluer pour prendre en charge les charges de travail changeantes.
Si votre entreprise souhaite contenir la croissance informatique interne, elle peut utiliser des services cloud externes pour augmenter ses ressources internes. Dans certains cas, cette redondance peut prendre la forme d'une offre SaaS (Software as a Service) qui permet aux entreprises d'effectuer une analyse de données sophistiquée en tant que service. L'approche SaaS offre des coûts plus bas, un démarrage plus rapide et une évolution continue de la technologie sous-jacente.
Infrastructure de sécurité Big Data
Plus l'analyse de Big Data est importante pour les entreprises, plus il sera important de sécuriser ces données. Par exemple, si vous êtes une entreprise de soins de santé, vous voudrez probablement utiliser des applications de données volumineuses pour déterminer les changements démographiques ou les changements dans les besoins des patients. Ces données sur vos composants doivent être protégées à la fois pour répondre aux exigences de conformité et pour protéger la vie privée des patients.
Vous devrez prendre en compte les personnes autorisées à voir les données et dans quelles circonstances elles sont autorisées à le faire. Vous devrez être en mesure de vérifier l'identité des utilisateurs ainsi que de protéger l'identité des patients.
Sources de données volumineuses opérationnelles
Il est important de comprendre que vous devez intégrer toutes les sources de données qui vous donneront une image complète de votre entreprise et verront comment les données influent sur la façon dont vous exploitez votre entreprise. À mesure que le monde change, il est important de comprendre que les données opérationnelles doivent maintenant englober un ensemble plus large de sources de données, y compris des sources non structurées telles que les données des médias sociaux sous toutes leurs formes.
Vous découvrirez de nouvelles approches émergentes de la gestion des données dans le monde du Big Data, notamment les architectures de bases de données de documents, de graphiques, de colonnes et de données géospatiales. Collectivement, ils sont appelés NoSQL, ou pas seulement les bases de données SQL. En substance, vous devez mapper les architectures de données aux types de transactions.
Cela vous aidera à vous assurer que les données correctes sont disponibles lorsque vous en avez besoin. Vous avez également besoin d'architectures de données prenant en charge un contenu complexe non structuré. Vous devez inclure à la fois des bases de données relationnelles et des bases de données non relationnelles dans votre approche de l'exploitation des mégadonnées. Il est également nécessaire d'inclure des sources de données non structurées, telles que les systèmes de gestion de contenu, afin de vous rapprocher de cette vue métier à 360 degrés.
Toutes ces sources de données opérationnelles ont plusieurs caractéristiques en commun:
-
Elles représentent des systèmes d'enregistrement qui gardent une trace des données critiques requises pour le fonctionnement quotidien de l'entreprise en temps réel.
-
Ils sont continuellement mis à jour en fonction des transactions effectuées dans les unités commerciales et sur le Web.
-
Pour que ces sources fournissent une représentation précise de l'activité, elles doivent combiner des données structurées et non structurées.
-
Ces systèmes doivent également pouvoir évoluer pour prendre en charge des milliers d'utilisateurs de manière cohérente. Ceux-ci peuvent inclure des systèmes de commerce électronique transactionnels, des systèmes de gestion de la relation client ou des applications de centres d'appels.