Vidéo: Un moteur de recherche pour le Big data par Gilles André, président de Polyspot 2024
Le big data a rendu possible le développement de moteurs de recherche en ligne très performants. Un moteur de recherche trouvant des pages Web basées sur des termes de recherche nécessite des algorithmes sophistiqués et la capacité de traiter un nombre stupéfiant de requêtes. Voici quatre des moteurs de recherche les plus utilisés:
-
Google
-
Microsoft Bing
-
Yahoo!
-
Ask
L'utilisation de Google surpasse celle de ses concurrents. En février 2015, on estime que Google reçoit 1,1 milliard de visiteurs uniques chaque mois. Bing est une seconde lointaine avec 350 millions d'euros; Yahoo! obtient 300 millions, et Ask, 245 millions. Bien que Google ne soit pas le moteur de recherche le plus ancien, il est devenu de loin le plus populaire. La quantité de données que Google traite chaque jour est estimée à environ 20 pétaoctets (2. 0 x 10 16 octets). Tout ce trafic est rentable pour Google - la majeure partie de ses revenus provient de la publicité.
Google fournit également des services informatiques aux organisations qui n'ont pas leurs propres capacités de traitement des mégadonnées. Google a récemment introduit Google Cloud Dataflow, qui permet aux entreprises de stocker, d'analyser et de traiter d'énormes quantités de données.