Accueil Finances personnelles Streaming Les algorithmes et filtres Bloom - les nuls

Streaming Les algorithmes et filtres Bloom - les nuls

Vidéo: Cash investigation - Au secours, mon patron est un algorithme (Intégrale) 2024

Vidéo: Cash investigation - Au secours, mon patron est un algorithme (Intégrale) 2024
Anonim

Les filtres Bloom sont au cœur de nombreux algorithmes de streaming. Créé il y a près de 50 ans par Burton H. Bloom, à une époque où l'informatique était encore très jeune, l'intention originale du créateur de cet algorithme était d'échanger espace (mémoire) et / ou temps (complexité) contre ce qu'il appelait erreurs admissibles Son document original s'intitule Compromis espace / temps dans le codage de hachage avec erreurs admissibles.

Vous pouvez vous interroger sur l'espace et le temps que Bloom considère comme des facteurs de motivation pour son algorithme. Imaginez que vous deviez déterminer si un élément est déjà apparu dans un flux en utilisant une structure de données précédemment discutée. Trouver quelque chose dans un flux implique que l'enregistrement et la recherche sont rapides, donc une table de hachage semble un choix idéal. Les tables de hachage nécessitent simplement l'ajout des éléments que vous souhaitez enregistrer et les stocker. Récupérer un élément à partir d'une table de hachage est rapide car la table de hachage utilise des valeurs facilement manipulées pour représenter l'élément, plutôt que l'élément lui-même (ce qui pourrait être assez complexe). Pourtant, stocker à la fois les éléments et un index à ces éléments a des limites. Si une table de hachage fait face à plus d'éléments qu'elle ne peut en supporter, tels que les éléments d'un flux continu et potentiellement infini, vous finirez par rencontrer des problèmes de mémoire à un moment donné.

Une considération essentielle pour les filtres de Bloom est que les faux positifs peuvent se produire, mais les faux négatifs ne le peuvent pas. Par exemple, un flux de données peut contenir des données de surveillance en temps réel pour une centrale électrique. Lors de l'utilisation d'un filtre Bloom, l'analyse du flux de données montrerait que les lectures attendues font probablement partie de l'ensemble des lectures autorisées, certaines erreurs étant autorisées. Cependant, lorsqu'une erreur se produit dans le système, la même analyse montre que les lectures ne font pas partie de l'ensemble des lectures autorisées. Les faux positifs sont peu susceptibles de causer des problèmes, mais l'absence de faux négatifs signifie que tout le monde reste en sécurité. En raison de la possibilité de faux positifs, les filtres tels que le filtre Bloom sont des structures de données probabilistes - ils ne fournissent pas une réponse certaine mais probable.

Les hachages, les entrées individuelles d'une table de hachage, sont rapides car ils agissent comme l'index d'un livre. Vous utilisez une fonction de hachage pour produire le hachage; l'entrée est un élément contenant des données complexes, et la sortie est un nombre simple qui agit comme un indice pour cet élément. Une fonction de hachage est déterministe car elle produit le même nombre chaque fois que vous l'alimentez avec une entrée de données spécifique.Vous utilisez le hachage pour localiser les informations complexes dont vous avez besoin. Les filtres Bloom sont utiles car ils constituent un moyen frugal d'enregistrer les traces de nombreux éléments sans avoir à les stocker comme le fait une table de hachage. Ils fonctionnent de manière simple et utilisent les éléments suivants comme ingrédients principaux:

  • Un vecteur de bit: Une liste d'éléments binaires, où chaque bit de l'élément peut avoir une valeur de 0 ou 1. La liste est longue nombre de bits appelés m. Plus m est grand, mieux c'est, bien qu'il existe des moyens de définir de manière optimale sa taille.
  • Une série de fonctions de hachage: Chaque fonction de hachage représente une valeur différente. Les fonctions de hachage peuvent rapidement croquer des données et produire des résultats uniformément distribués, dont les résultats vont du minimum au maximum des valeurs de sortie du hachage.
Streaming Les algorithmes et filtres Bloom - les nuls

Le choix des éditeurs

Streaming Les algorithmes et filtres Bloom - les nuls

Streaming Les algorithmes et filtres Bloom - les nuls

Au cœur de nombreux algorithmes de streaming sont les filtres Bloom. Créé il y a près de 50 ans par Burton H. Bloom, à une époque où l'informatique était encore très jeune, l'intention originale du créateur de cet algorithme était d'échanger espace (mémoire) et / ou temps (complexité) contre ce qu'il appelait erreurs admissibles. Son papier original est intitulé ...

Stocker des données dans Bigtables - des nuls

Stocker des données dans Bigtables - des nuls

Un Bigtable a des tables comme un RDBMS, mais contrairement à un SGBDR, des tables Bigtable généralement n'ont pas de relations avec d'autres tables. Au lieu de cela, les données complexes sont regroupées dans une seule table. Une table dans un Bigtable se compose de groupes de colonnes, appelées familles de colonnes, et d'une clé de ligne. Celles-ci permettent une recherche rapide de ...

Flux Flux de données - nuls

Flux Flux de données - nuls

Lorsque les flux de données sont énormes, tout stocker peut être difficile, voire impossible. En fait, stocker tout cela pourrait même ne pas être utile. Voici quelques chiffres de ce que vous pouvez espérer voir arriver en une minute sur Internet: 150 millions d'e-mails envoyés 350 000 nouveaux tweets envoyés ...

Le choix des éditeurs

Google Analytics SDK application iPhone - les nuls

Google Analytics SDK application iPhone - les nuls

Le suivi de l'utilisation mobile fait désormais partie intégrante de la bonne analyse Web, à condition que les utilisateurs utilisent le navigateur mobile pour accéder à vos pages de destination et surfer sur votre site. Certains programmes de suivi des statistiques sur les médias sociaux rendent ce processus plus intuitif que d'autres. Pour aller de l'avant avec Google Analytics SDK pour votre application iPhone, suivez simplement ces ...

Principes de base des métriques de contenu partagé - Indicateurs

Principes de base des métriques de contenu partagé - Indicateurs

Les métriques de contenu partagé ont beaucoup d'importance maintenant dans l'espace web social. Sur le web social, le partage est un donné. Fini le temps où les gens voulaient visiter ou promouvoir un site web avec un contenu verrouillé. S'ils voient quelque chose de valeur, ils veulent tout de suite dire à tout le monde qu'ils savent ...

Principes de base des métriques de médias sociaux - Indicateurs

Principes de base des métriques de médias sociaux - Indicateurs

Les indicateurs de médias sociaux sont détaillés et concrets. vos stratégies de médias sociaux fonctionnent (ou pas) pour vous ou vos clients. Ces statistiques quantifient et évaluent vos efforts sur les médias sociaux et agissent comme une feuille de route qui montre comment vous pouvez améliorer ce que vous faites en ligne. Les métriques mesurent ce qui se passe ...

Le choix des éditeurs

Accueil des invités à votre destination Mariage - Les nuls

Accueil des invités à votre destination Mariage - Les nuls

Avoir un mariage à destination signifie que vous serez le voyageur d'accueil. Idéalement, vous ou quelqu'un de votre fête de mariage devez être présents pour les accueillir et les aider à se repérer quand ils arrivent. Sinon, alertez la réception pour savoir qui est prévu. Demandez à ce que vos amis et les membres de votre famille soient rapidement conduits dans leur chambre. ...

Etiquette de mariage pour les nuls Cheat Sheet - mannequins

Etiquette de mariage pour les nuls Cheat Sheet - mannequins

Règles de l'étiquette de mariage ont détendu un peu au fil du temps, mais le bon sens et L'étiquette de base est toujours nécessaire à chaque étape de la planification du mariage - et au grand jour lui-même. Se familiariser avec ce qu'il faut faire avant, pendant et après votre mariage aidera à faire en sorte que tout le monde profite de toutes vos festivités de mariage.

Quand vous êtes en colère: Agressivité À faire et à ne pas faire - les nuls

Quand vous êtes en colère: Agressivité À faire et à ne pas faire - les nuls

Quand vous essayez de gérer votre colère et votre agressivité, considérez ces choses à faire et à ne pas faire pour obtenir ce que vous voulez tout en gardant votre sang-froid. Anger Do: Sois compétitif. Toutes les personnes qui réussissent sont compétitives. L'astuce consiste à savoir quand et comment rivaliser, et quand coopérer pour réussir. Soyez fort dans ...