Table des matières:
- Extraction et enrichissement d'entités
- Recherche et alerte
- Fonctions d'agrégation
- Création de graphiques et veille stratégique
Vidéo: Introduction to NoSQL visualization with Databasel 2024
Le stockage et la récupération de grandes quantités de données et leur rapidité sont excellents, et une fois que vous avez vos nouvelles données gérées dans NoSQL, vous pouvez faire de grandes choses.
Extraction et enrichissement d'entités
Vous pouvez utiliser des déclencheurs de base de données, des actions d'alerte et des systèmes externes pour analyser les données source. Peut-être que c'est surtout du texte libre mais mentionne des sujets connus. Ces déclencheurs et ces actions d'alerte peuvent mettre en évidence le texte comme étant une personne ou une organisation, en marquant efficacement le contenu lui-même et le document qu'il contient.
Un bon exemple est le contenu d'un article de presse. Vous pouvez utiliser un outil comme Apache Stanbol ou OpenCalais pour identifier les termes clés. Ces outils peuvent voir "le président Poutine" et décider que cela concerne une personne appelée Vladimir Poutine, qui est russe, et qui est actuellement le président de la Fédération de Russie.
D'autres exemples incluent les noms de maladies et de médicaments, les organisations, les sujets de conversation, les produits mentionnés et si un commentaire était positif ou négatif.
Ce sont tous des exemples de extraction d'entités (qui est le processus d'extraction automatique des types d'objets de leurs noms textuels) . En identifiant les termes clés, vous pouvez les marquer ou les placer dans un élément XML, ce qui vous permet de rechercher plus efficacement le contenu.
L'enrichissement d'une entité consiste à ajouter des informations basées sur le texte original en plus de l'identifier. Dans l'exemple de Poutine, vous pouvez transformer le mot texte "Poutine" en président Poutine. Alternativement, vous pouvez transformer "Londres" en Londres.
Vous pouvez afficher ces données dans une interface utilisateur en tant que texte surligné avec un lien vers d'autres informations sur chaque sujet.
Vous pouvez enrichir votre site en utilisant la recherche en texte libre, les alertes, les déclencheurs de bases de données et les intégrations à des logiciels externes tels que TEMIS Luxid et SmartLogic.
Recherche et alerte
Une fois que vous stockez vos informations, vous pouvez vouloir les rechercher. La recherche en texte libre est simple, mais après l'extraction de l'entité, vous avez plus d'options. Vous pouvez rechercher spécifiquement une personne nommée "Orange" (comme dans William d'Orange) plutôt que de rechercher des enregistrements qui mentionnent le terme orange - qui, bien sûr, est aussi une couleur et un fruit.
Cela entraîne une recherche plus granulaire. Il permet également la navigation à facettes. Si vous allez sur Amazon et recherchez Harry Potter, vous verrez des catégories de livres, de films, de jeux, etc. La catégorie de produits est un exemple de facette , qui vous montre un aspect des données dans les résultats de la recherche, à savoir les valeurs les plus courantes de chaque facette dans tous les résultats de recherche, même ceux qui ne sont pas sur la page actuelle.
Les interfaces utilisateur peuvent prendre en charge de riches explorations de données (ainsi que des recherches Google-esques de base). Les utilisateurs peuvent également les utiliser pour sauvegarder et charger les recherches précédentes.
Vous pouvez définir des critères de recherche enregistrés afin que les alertes soient activées lorsque des enregistrements nouvellement ajoutés correspondent à ces critères. Ainsi, si un nouvel enregistrement correspond à vos critères de recherche, une action se produit. Peut-être que "Poutine" devient Poutine
Tous les moteurs de recherche ne sont pas capables de faire de chaque terme de requête une alerte. Certains sont limités aux champs de texte; d'autres ne peuvent pas faire de critères géospatiaux. Assurez-vous que le vôtre peut gérer les alertes que vous devez configurer.
Fonctions d'agrégation
Une fois que vous avez trouvé des informations pertinentes, vous pouvez creuser plus profondément. Selon la source, vous pouvez vous demander combien de pays ont un PIB supérieur à 400 milliards de dollars, ou quel est l'âge moyen de tous les membres de votre arbre généalogique, ou où se trouve le plus de morsures de serpent en Australie. Ces exemples illustrent comment les analyses sont effectuées sur un ensemble de résultats de recherche. Il s'agit respectivement des calculs de dénombrement, de moyenne et de géocartographie.
Pouvoir effectuer de tels calculs à côté des données présente plusieurs avantages. Le premier avantage est que vous pouvez utiliser les index pour accélérer les choses. Deuxièmement, ces index sont susceptibles d'être mis en mémoire cache, ce qui les rend encore plus rapides. Troisièmement, dans la mémoire, les index sont particulièrement utiles pour une base de données NoSQL utilisant le stockage Hadoop File System (HDFS). HDFS ne fait pas d'indexage natif ou de stockage de colonnes en mémoire pour les calculs d'agrégation rapide lui-même - il nécessite une base de données NoSQL en haut pour ce faire.
La navigation à facettes est un exemple d'agrégations basées sur le nombre de résultats de recherche qui s'affichent dans une interface utilisateur. La même chose est vraie pour un calendrier montrant le nombre d'enregistrements qui mentionnent un moment particulier. Par exemple, voulez-vous afficher les résultats de cette année, de ce mois ou de cette heure?
Si vous voulez cette fonctionnalité, assurez-vous que votre base de données a la capacité de calculer efficacement les agrégats à côté des données. La plupart des bases de données NoSQL le font, mais d'autres non.
Création de graphiques et veille stratégique
La prochaine extension d'interface utilisateur évidente consiste à afficher et à afficher des résumés de tableaux pour les informations de gestion en direct et les analyses historiques de Business Intelligence.
La plupart des bases de données NoSQL fournissent une API REST facile à intégrer dans leurs bases de données. Cela signifie que vous pouvez brancher une gamme de niveaux d'application, ou même connecter directement des applications JavaScript à ces bases de données. Une variété d'excellentes bibliothèques de cartographie sont disponibles pour JavaScript. Vous pouvez même utiliser l'écosystème R pour créer des diagrammes basés sur les données contenues dans ces bases de données, après l'installation d'un connecteur de base de données approprié.
Certaines bases de données NoSQL fournissent même un plug-in de base de données relationnelle ODBC ou JDBC. La création d'index au sein d'un enregistrement donné et leur affichage en tant que vue relationnelle constituent un moyen efficace de transformer des données non structurées dans une base de données de documents NoSQL en données pouvant être analysées à l'aide d'un outil de Business Intelligence.
Vérifiez si votre fournisseur de base de données NoSQL fournit des outils de visualisation ou a des partenaires avec des outils qui peuvent se connecter à ces bases de données. Les outils les plus courants incluent Tableau Server, qui est un serveur partagé d'intelligence d'entreprise moderne qui prend en charge la publication de rapports interactifs sur des données dans diverses bases de données, y compris des bases de données NoSQL.