Table des matières:
Vidéo: Le big data - 60 secondes pour comprendre 2024
Derrière toutes les tendances importantes de la dernière décennie, y compris l'orientation service, le cloud computing, la virtualisation et le big data, est une technologie de base appelée informatique distribuée. Simplement, sans distribuer de l'informatique, aucun de ces progrès ne serait possible.
L'informatique distribuée est une technique qui permet à des ordinateurs individuels d'être mis en réseau ensemble à travers des zones géographiques comme s'il s'agissait d'un environnement unique. Vous trouverez de nombreuses implémentations différentes de l'informatique distribuée. Dans certaines topologies, les entités informatiques individuelles se transmettent simplement des messages les uns aux autres.
Dans d'autres situations, un environnement informatique distribué peut partager des ressources allant de la mémoire aux réseaux et au stockage. Tous les modèles d'informatique distribuée ont un attribut commun: Il s'agit d'un groupe d'ordinateurs en réseau qui travaillent ensemble pour exécuter une charge de travail ou un processus.
DARPA et big data
Le modèle d'informatique distribuée le plus connu, Internet, est à la base de tout, du commerce électronique au cloud computing en passant par la gestion des services et la virtualisation. Internet a été conçu comme un projet de recherche financé par les États-Unis DARPA.
Il a été conçu pour créer un système de mise en réseau interconnecté qui soutiendrait la recherche collaborative non commerciale entre scientifiques. Au tout début d'Internet, ces ordinateurs étaient souvent reliés par des lignes téléphoniques! À moins d'avoir vécu cette frustration, vous ne pouvez qu'imaginer à quel point ces connexions étaient lentes et fragiles.
À mesure que la technologie évoluait au cours de la prochaine décennie, des protocoles communs tels que le protocole TCP (Transmission Control Protocol) ont contribué à la prolifération de la technologie et du réseau. Lorsque le protocole Internet (IP) a été ajouté, le projet est passé d'un réseau fermé pour une collection de scientifiques à une plate-forme potentiellement commerciale pour transférer des e-mails à travers le monde.
Tout au long des années 1980, de nouveaux services Internet ont commencé à apparaître sur le marché comme une alternative commerciale au réseau DARPA. En 1992, le Congrès des États-Unis a adopté la Loi sur la technologie scientifique et de pointe qui, pour la première fois, permettait l'utilisation commerciale de cette puissante technologie de réseautage. Avec sa croissance explosive continue, Internet est vraiment un réseau distribué mondial et reste le meilleur exemple de la puissance de l'informatique distribuée.
La valeur d'un modèle Big Data cohérent
Quelle différence cet effort DARPA a-t-il apporté dans le mouvement vers l'informatique distribuée?Avant la commercialisation d'Internet, des centaines d'entreprises et d'organisations créaient une infrastructure logicielle destinée à fournir une plate-forme commune pour prendre en charge un environnement informatique hautement distribué.
Cependant, chaque fournisseur ou organisme de normalisation a élaboré ses propres appels de procédures à distance (RPC) que tous les clients, développeurs de logiciels commerciaux et partenaires devaient adopter et prendre en charge. RPC est un mécanisme primitif utilisé pour envoyer du travail à un ordinateur distant et nécessite généralement d'attendre que le travail à distance se termine avant que d'autres travaux puissent continuer.
Avec les fournisseurs qui implémentaient des RPC propriétaires, il devenait impossible d'imaginer qu'une entreprise puisse créer une norme universelle pour l'informatique distribuée. Au milieu des années 1990, les protocoles Internet ont remplacé ces approches primitives et sont devenus la base de ce que l'informatique distribuée est aujourd'hui. Après que cela a été réglé, les utilisations de cette approche à l'informatique en réseau ont commencé à prospérer.