Accueil Finances personnelles Streaming Les algorithmes et filtres Bloom - les nuls

Streaming Les algorithmes et filtres Bloom - les nuls

Vidéo: Cash investigation - Au secours, mon patron est un algorithme (Intégrale) 2025

Vidéo: Cash investigation - Au secours, mon patron est un algorithme (Intégrale) 2025
Anonim

Les filtres Bloom sont au cœur de nombreux algorithmes de streaming. Créé il y a près de 50 ans par Burton H. Bloom, à une époque où l'informatique était encore très jeune, l'intention originale du créateur de cet algorithme était d'échanger espace (mémoire) et / ou temps (complexité) contre ce qu'il appelait erreurs admissibles Son document original s'intitule Compromis espace / temps dans le codage de hachage avec erreurs admissibles.

Vous pouvez vous interroger sur l'espace et le temps que Bloom considère comme des facteurs de motivation pour son algorithme. Imaginez que vous deviez déterminer si un élément est déjà apparu dans un flux en utilisant une structure de données précédemment discutée. Trouver quelque chose dans un flux implique que l'enregistrement et la recherche sont rapides, donc une table de hachage semble un choix idéal. Les tables de hachage nécessitent simplement l'ajout des éléments que vous souhaitez enregistrer et les stocker. Récupérer un élément à partir d'une table de hachage est rapide car la table de hachage utilise des valeurs facilement manipulées pour représenter l'élément, plutôt que l'élément lui-même (ce qui pourrait être assez complexe). Pourtant, stocker à la fois les éléments et un index à ces éléments a des limites. Si une table de hachage fait face à plus d'éléments qu'elle ne peut en supporter, tels que les éléments d'un flux continu et potentiellement infini, vous finirez par rencontrer des problèmes de mémoire à un moment donné.

Une considération essentielle pour les filtres de Bloom est que les faux positifs peuvent se produire, mais les faux négatifs ne le peuvent pas. Par exemple, un flux de données peut contenir des données de surveillance en temps réel pour une centrale électrique. Lors de l'utilisation d'un filtre Bloom, l'analyse du flux de données montrerait que les lectures attendues font probablement partie de l'ensemble des lectures autorisées, certaines erreurs étant autorisées. Cependant, lorsqu'une erreur se produit dans le système, la même analyse montre que les lectures ne font pas partie de l'ensemble des lectures autorisées. Les faux positifs sont peu susceptibles de causer des problèmes, mais l'absence de faux négatifs signifie que tout le monde reste en sécurité. En raison de la possibilité de faux positifs, les filtres tels que le filtre Bloom sont des structures de données probabilistes - ils ne fournissent pas une réponse certaine mais probable.

Les hachages, les entrées individuelles d'une table de hachage, sont rapides car ils agissent comme l'index d'un livre. Vous utilisez une fonction de hachage pour produire le hachage; l'entrée est un élément contenant des données complexes, et la sortie est un nombre simple qui agit comme un indice pour cet élément. Une fonction de hachage est déterministe car elle produit le même nombre chaque fois que vous l'alimentez avec une entrée de données spécifique.Vous utilisez le hachage pour localiser les informations complexes dont vous avez besoin. Les filtres Bloom sont utiles car ils constituent un moyen frugal d'enregistrer les traces de nombreux éléments sans avoir à les stocker comme le fait une table de hachage. Ils fonctionnent de manière simple et utilisent les éléments suivants comme ingrédients principaux:

  • Un vecteur de bit: Une liste d'éléments binaires, où chaque bit de l'élément peut avoir une valeur de 0 ou 1. La liste est longue nombre de bits appelés m. Plus m est grand, mieux c'est, bien qu'il existe des moyens de définir de manière optimale sa taille.
  • Une série de fonctions de hachage: Chaque fonction de hachage représente une valeur différente. Les fonctions de hachage peuvent rapidement croquer des données et produire des résultats uniformément distribués, dont les résultats vont du minimum au maximum des valeurs de sortie du hachage.
Streaming Les algorithmes et filtres Bloom - les nuls

Le choix des éditeurs

: Utilisation de l'équation du cercle standard - dummies

: Utilisation de l'équation du cercle standard - dummies

Si vous avez une question SAT Examen de mathématiques qui vous donne l'équation d'un cercle, vous aurez probablement besoin de convertir cette équation à l'équation du cercle standard. Les questions pratiques suivantes vous donnent l'équation d'un cercle et vous demandent de trouver son rayon et son centre. Questions d'entraînement Questions 1 et ...

SAT Pratique Mathématiques Questions: Séquences arithmétiques et géométriques - mannequins

SAT Pratique Mathématiques Questions: Séquences arithmétiques et géométriques - mannequins

Mathématiques implique parfois de reconnaître des schémas et de voir où ces modèles mènent. Le SAT vous demande parfois de jouer au mathématicien avec deux types de motifs: arithmétique et géométrique. Le mot mathématique pour le motif, en passant, est la séquence. Découvrez cette séquence arithmétique: 2, 5, 8, 11, 14 ... Notez que chaque nombre est ...

SAT Exercice de maths-FOIL Operations - mannequins

SAT Exercice de maths-FOIL Operations - mannequins

L'examen de mathématiques SAT vous posera quelques questions Vous devez savoir comment exécuter une opération FOIL, où vous multipliez un polynôme dans l'ordre: Premier, Extérieur, Intérieur et Dernier. Les questions de pratique suivantes vous demandent de trouver le produit de deux binômes et la valeur d'une variable en utilisant ...

Le choix des éditeurs

Prier le Rosaire et méditer sur les Mystères - mannequins

Prier le Rosaire et méditer sur les Mystères - mannequins

Selon la pieuse tradition catholique, au 13ème siècle Marie, la Mère de Dieu, est apparue à saint Dominique de Guzman, lui a donné un chapelet et a demandé qu'au lieu de prier les Psaumes sur des perles ou des noeuds, les fidèles prient l'Ave Maria, Notre Père et la Gloire soit. Quinze décennies ont constitué l'origine dominicaine ...

Dix choses à savoir sur le pape Benoît XVI - Paroisse

Dix choses à savoir sur le pape Benoît XVI - Paroisse

Le pape Benoît XVI a été élu en 2007 par le Collège des Cardinaux, et il a démissionné en 2012. Les controverses faisaient partie de son mandat. Il était le 265e pape de l'histoire de l'Église catholique romaine et le premier à démissionner en près de 600 ans.

La Réforme et l'Église Catholique - mannequins

La Réforme et l'Église Catholique - mannequins

Au Moyen Âge, la philosophie grecque (incarnée par Platon et Aristote ) a été utilisé pour aider à développer un chrétien, qui est devenu partenaire de la théologie sacrée. La langue latine était connue et utilisée - principalement dans des contextes religieux et juridiques. Les arts libéraux et les sciences religieuses ont été les principaux piliers de l'éducation universitaire et de la chrétienté ...

Le choix des éditeurs

Comment fonctionne BPaaS dans le monde réel du Cloud Computing - les nuls

Comment fonctionne BPaaS dans le monde réel du Cloud Computing - les nuls

Si vous avez décidé de utiliser BPaaS (Business Process as a Service) dans un modèle de cloud hybride en tant que plate-forme de prestation de services, vous devez comprendre comment combiner des services en fonction des processus que vous souhaitez exécuter. Comme le montre la figure suivante, un service de processus métier peut être lié à divers ...

Développer un environnement Cloud hybride sécurisé - des mannequins

Développer un environnement Cloud hybride sécurisé - des mannequins

Une approche réfléchie de la sécurité peut réussir à atténuer de nombreux risques de sécurité dans un environnement de cloud hybride. Pour développer un environnement hybride sécurisé, vous devez évaluer l'état actuel de votre stratégie de sécurité ainsi que la stratégie de sécurité proposée par votre fournisseur de cloud. Évaluer votre état actuel de sécurité Dans un environnement hybride, la sécurité ...

Gestion des charges de travail dans un modèle de cloud hybride - mannequins

Gestion des charges de travail dans un modèle de cloud hybride - mannequins

Modèle de nuage. La gestion, dans ce contexte, fait référence à la manière dont les ressources sont affectées pour traiter les charges de travail. Les affectations peuvent être basées sur la disponibilité des ressources, les priorités métier ou la planification d'événements. Dans l'ère de l'informatique mainframe unifiée, la gestion de la charge de travail était assez simple. Quand une tâche ...