Accueil Finances personnelles Flux Flux de données - nuls

Flux Flux de données - nuls

Vidéo: Algorithmes pour flux de données 2024

Vidéo: Algorithmes pour flux de données 2024
Anonim

Lorsque les données circulent en masse quantités, tout stocker peut être difficile, voire impossible. En fait, stocker tout cela pourrait même ne pas être utile. Voici quelques chiffres de ce que vous pouvez espérer voir arriver en une minute sur Internet:

  • 150 millions d'e-mails envoyés
  • 350 000 nouveaux tweets envoyés sur Twitter
  • 2. 4 millions de requêtes demandées sur Google
  • 700 000 personnes se sont connectées à leur compte sur Facebook

Compte tenu de ces volumes, accumuler les données toute la journée pour l'analyse incrémentale pourrait ne pas sembler efficace. Vous le stockez simplement quelque part et vous l'analysez le jour suivant ou après (ce qui est la stratégie d'archivage répandue typique des bases de données et des entrepôts de données). Cependant, les requêtes de données utiles ont tendance à poser des questions sur les données les plus récentes dans le flux, et les données deviennent moins utiles lorsqu'elles vieillissent (dans certains secteurs, tels que financier, un jour peut prendre beaucoup de temps).

Parfois, rendant les choses encore plus difficiles à gérer, les données peuvent arriver si vite et en si grandes quantités qu'il est impossible de les écrire sur le disque: Les nouvelles informations arrivent plus vite que le temps nécessaire pour les écrire. disque dur. C'est un problème typique des expériences de particules avec des accélérateurs de particules tels que le Large Hadron Collider, qui demande aux scientifiques de décider quelles données conserver. Bien sûr, vous pouvez mettre les données en file d'attente pendant un certain temps, mais pas trop longtemps, car la file d'attente va rapidement se développer et devenir impossible à maintenir. Par exemple, si elles sont conservées en mémoire, les données de la file d'attente entraîneront bientôt une erreur de mémoire insuffisante.

Parce que les nouveaux flux de données peuvent rendre obsolètes les traitements antérieurs sur les anciennes données et que la procrastination n'est pas une solution, les gens ont conçu plusieurs stratégies pour traiter instantanément des volumes de données massifs et variables. Les personnes utilisent trois méthodes pour traiter de grandes quantités de données:

Stocké:

  • Certaines données sont stockées car elles peuvent aider à répondre à des questions peu claires ultérieurement. Cette méthode repose sur des techniques pour la stocker immédiatement et l'analyser très rapidement, aussi massive soit-elle. Résumé:
  • Certaines données sont résumées parce que le fait de tout garder tel quel n'a aucun sens; seules les données importantes sont conservées. Consommé:
  • Les données restantes sont consommées car leur utilisation est prédéterminée. Les algorithmes peuvent instantanément lire, digérer et transformer les données en informations. Après cela, le système oublie les données pour toujours. Quand on parle de données massives arrivant dans un système informatique, on l'entend souvent comparé à l'eau: des données en continu, des flux de données, des tuyaux d'incendie de données.

Vous découvrez comment les flux de données consomment de l'eau du robinet: l'ouverture du robinet vous permet de stocker l'eau dans des tasses ou des bouteilles ou de l'utiliser pour cuisiner, frotter des aliments, nettoyer des assiettes ou se laver les mains. En tout cas, la majeure partie ou la totalité de l'eau a disparu, mais elle s'avère très utile et même vitale.

Flux Flux de données - nuls

Le choix des éditeurs

Streaming Les algorithmes et filtres Bloom - les nuls

Streaming Les algorithmes et filtres Bloom - les nuls

Au cœur de nombreux algorithmes de streaming sont les filtres Bloom. Créé il y a près de 50 ans par Burton H. Bloom, à une époque où l'informatique était encore très jeune, l'intention originale du créateur de cet algorithme était d'échanger espace (mémoire) et / ou temps (complexité) contre ce qu'il appelait erreurs admissibles. Son papier original est intitulé ...

Stocker des données dans Bigtables - des nuls

Stocker des données dans Bigtables - des nuls

Un Bigtable a des tables comme un RDBMS, mais contrairement à un SGBDR, des tables Bigtable généralement n'ont pas de relations avec d'autres tables. Au lieu de cela, les données complexes sont regroupées dans une seule table. Une table dans un Bigtable se compose de groupes de colonnes, appelées familles de colonnes, et d'une clé de ligne. Celles-ci permettent une recherche rapide de ...

Flux Flux de données - nuls

Flux Flux de données - nuls

Lorsque les flux de données sont énormes, tout stocker peut être difficile, voire impossible. En fait, stocker tout cela pourrait même ne pas être utile. Voici quelques chiffres de ce que vous pouvez espérer voir arriver en une minute sur Internet: 150 millions d'e-mails envoyés 350 000 nouveaux tweets envoyés ...

Le choix des éditeurs

Google Analytics SDK application iPhone - les nuls

Google Analytics SDK application iPhone - les nuls

Le suivi de l'utilisation mobile fait désormais partie intégrante de la bonne analyse Web, à condition que les utilisateurs utilisent le navigateur mobile pour accéder à vos pages de destination et surfer sur votre site. Certains programmes de suivi des statistiques sur les médias sociaux rendent ce processus plus intuitif que d'autres. Pour aller de l'avant avec Google Analytics SDK pour votre application iPhone, suivez simplement ces ...

Principes de base des métriques de contenu partagé - Indicateurs

Principes de base des métriques de contenu partagé - Indicateurs

Les métriques de contenu partagé ont beaucoup d'importance maintenant dans l'espace web social. Sur le web social, le partage est un donné. Fini le temps où les gens voulaient visiter ou promouvoir un site web avec un contenu verrouillé. S'ils voient quelque chose de valeur, ils veulent tout de suite dire à tout le monde qu'ils savent ...

Principes de base des métriques de médias sociaux - Indicateurs

Principes de base des métriques de médias sociaux - Indicateurs

Les indicateurs de médias sociaux sont détaillés et concrets. vos stratégies de médias sociaux fonctionnent (ou pas) pour vous ou vos clients. Ces statistiques quantifient et évaluent vos efforts sur les médias sociaux et agissent comme une feuille de route qui montre comment vous pouvez améliorer ce que vous faites en ligne. Les métriques mesurent ce qui se passe ...

Le choix des éditeurs

Accueil des invités à votre destination Mariage - Les nuls

Accueil des invités à votre destination Mariage - Les nuls

Avoir un mariage à destination signifie que vous serez le voyageur d'accueil. Idéalement, vous ou quelqu'un de votre fête de mariage devez être présents pour les accueillir et les aider à se repérer quand ils arrivent. Sinon, alertez la réception pour savoir qui est prévu. Demandez à ce que vos amis et les membres de votre famille soient rapidement conduits dans leur chambre. ...

Etiquette de mariage pour les nuls Cheat Sheet - mannequins

Etiquette de mariage pour les nuls Cheat Sheet - mannequins

Règles de l'étiquette de mariage ont détendu un peu au fil du temps, mais le bon sens et L'étiquette de base est toujours nécessaire à chaque étape de la planification du mariage - et au grand jour lui-même. Se familiariser avec ce qu'il faut faire avant, pendant et après votre mariage aidera à faire en sorte que tout le monde profite de toutes vos festivités de mariage.

Quand vous êtes en colère: Agressivité À faire et à ne pas faire - les nuls

Quand vous êtes en colère: Agressivité À faire et à ne pas faire - les nuls

Quand vous essayez de gérer votre colère et votre agressivité, considérez ces choses à faire et à ne pas faire pour obtenir ce que vous voulez tout en gardant votre sang-froid. Anger Do: Sois compétitif. Toutes les personnes qui réussissent sont compétitives. L'astuce consiste à savoir quand et comment rivaliser, et quand coopérer pour réussir. Soyez fort dans ...