Accueil Finances personnelles Text Analytics pour les Big Data non structurées - dummies

Text Analytics pour les Big Data non structurées - dummies

Vidéo: Analysez vos données textuelles avec SAS® Text Analytics 2025

Vidéo: Analysez vos données textuelles avec SAS® Text Analytics 2025
Anonim

De nombreuses méthodes existent pour analyser les données non structurées pour votre initiative Big Data. Historiquement, ces techniques sont issues de domaines techniques tels que le traitement du langage naturel (NLP), la découverte de connaissances, l'exploration de données, la recherche d'informations et les statistiques. L'analyse de texte consiste à analyser le texte non structuré, à extraire des informations pertinentes et à les transformer en informations structurées pouvant être exploitées de différentes manières.

Les processus d'analyse et d'extraction tirent parti des techniques issues de la linguistique computationnelle, des statistiques et d'autres disciplines de l'informatique.

Parfois, un exemple peut aider à expliquer un sujet complexe. Supposons que vous travaillez pour le département marketing dans une entreprise de téléphonie sans fil. Vous venez de lancer deux nouveaux plans d'appel - Plan A et Plan B - et vous n'obtenez pas l'adhésion souhaitée sur le Plan A. Le texte non structuré provenant des notes du centre d'appels peut vous donner un aperçu de la raison pour laquelle cela s'est produit.

Les mots soulignés fournissent l'information dont vous pourriez avoir besoin pour comprendre pourquoi le plan A ne gagne pas une adoption rapide. Par exemple, l'entité Plan A apparaît dans toutes les notes du centre d'appels, indiquant que les rapports mentionnent le plan.

Les termes minutes de transfert, données 4 Go, plan de données, et coûteux sont la preuve qu'il existe un problème avec les minutes de transfert, le plan de données et le prix. Des mots comme ridicule et stupide donnent un aperçu du sentiment de l'appelant, qui dans ce cas est négatif.

Le processus d'analyse de texte utilise divers algorithmes, tels que la compréhension de la structure des phrases, pour analyser le texte non structuré, puis extraire des informations et transformer ces informations en données structurées. Les données structurées extraites du texte non structuré sont illustrées dans le Tableau 13-1.

Identifiant Entité Problème Sentiment
Cust XYZ Plan A minutes de retournement Neutre
Cust ABC Plan A Renvoi des minutes Négatif
XXXX Plan A Cher Neutre
XXXX Plan A Plan de données Neutre
Cust XYT > Plan A Plan de données Négatif Vous pouvez regarder ceci et dire: «Mais j'aurais pu le comprendre en regardant les dossiers du centre d'appels. "Cependant, ce ne sont là qu'un petit sous-ensemble de l'information enregistrée par des milliers d'agents du centre d'appels. Chaque agent individuel ne peut pas détecter une tendance générale concernant le problème avec chaque plan offert par l'entreprise.

Les agents n'ont pas le temps ou l'obligation de partager ces informations avec tous les autres agents du centre d'appels susceptibles d'obtenir le même nombre d'appels concernant le plan A. Toutefois, après que ces informations ont été agrégées et traitées à l'aide d'algorithmes d'analyse textuelle peut émerger de ces données non structurées. C'est ce qui rend l'analyse de texte si puissante.

La recherche consiste à récupérer un document en fonction de ce que les utilisateurs finaux savent déjà qu'ils recherchent. L'analyse de texte consiste à découvrir des informations. Bien que l'analyse de texte diffère de la recherche, elle peut augmenter les techniques de recherche. Par exemple, l'analyse de texte combinée à la recherche peut être utilisée pour mieux classer ou classifier des documents et pour produire des résumés ou des résumés de documents.

Il existe quatre technologies: la requête, l'exploration de données, la recherche et l'analyse de texte. Sur le côté gauche de la table sont query et search, qui sont tous les deux sur la récupération. Par exemple, un utilisateur final peut interroger une base de données pour savoir combien de clients ont cessé d'utiliser les services de l'entreprise au cours du dernier mois.

La requête retournera un seul nombre. Ce n'est qu'en demandant des requêtes plus nombreuses et différentes que l'utilisateur final obtiendra les informations nécessaires pour déterminer pourquoi les clients partent. De même, la recherche par mot-clé permet à l'utilisateur final de trouver les documents qui contiennent les noms des concurrents d'une entreprise. La recherche retournerait un groupe de documents. Ce n'est qu'en lisant les documents que l'utilisateur final trouverait des réponses pertinentes.

Récupération

Text Analytics pour les Big Data non structurées - dummies

Le choix des éditeurs

Pour les seniors: Comment travailler avec Windows dans Microsoft Windows - les nuls

Pour les seniors: Comment travailler avec Windows dans Microsoft Windows - les nuls

Windows, avec un W majuscule, tire son nom de sa caractéristique principale: Windows, avec un w minuscule. Se familiariser avec Windows signifie apprendre à ouvrir, fermer, redimensionner, déplacer et basculer entre les fenêtres, ce qui est la clé pour jongler avec succès avec plusieurs activités. Chaque programme que vous exécutez occupe sa propre fenêtre. Une fenêtre peut occuper une partie de ...

Comment accepter ou rejeter les cookies dans Safari - dummies

Comment accepter ou rejeter les cookies dans Safari - dummies

Un cookie est un petit fichier qu'un site Web enregistre automatiquement sur le disque dur de votre Mac. Il contient des informations, telles que vos préférences ou votre date de naissance, que le site utilisera lors de vos prochaines visites. Dans Mac OS X Snow Leopard, Safari vous permet de choisir d'accepter ou non tous les cookies ...

Le choix des éditeurs

Construire des boîtes et des lignes Bézier dans QuarkXPress - des nuls

Construire des boîtes et des lignes Bézier dans QuarkXPress - des nuls

Pour créer une boîte ou une ligne dans QuarkXPress plus complexe qu'un simple rectangle, ovale ou starburst, vous entrez dans le domaine du chemin de Bézier. Si vous avez utilisé l'outil Plume dans Adobe Illustrator ou Photoshop, vous comprenez déjà les chemins de Bézier. Il faut un peu de pratique et un esprit détendu ...

Création d'un rapport avec Crystal Reports 10 - témoins

Création d'un rapport avec Crystal Reports 10 - témoins

Lorsque vous démarrez Crystal Reports 10, généralement l'une des trois choses suivantes: créer un rapport, modifier un rapport ou exécuter un rapport sur les données de votre base de données. Les rapports prennent des données à partir d'une base de données, les traitent, les formatent et les affichent ensuite sur une imprimante, un écran d'ordinateur ou un site Web. Crystal Reports ...

Traitant des commentaires Javadoc dans Eclipse - mannequins

Traitant des commentaires Javadoc dans Eclipse - mannequins

Lorsque vous utilisez Eclipse pour écrire du code Java, n'oubliez pas de éditez les commentaires de Javadoc (les choses qui commencent par / **). Vous pouvez ajouter des informations utiles lorsque vous modifiez les commentaires Javadoc et lorsque vous les modifiez, l'aide au code d'Eclipse propose des suggestions. N'oubliez pas ces astuces lorsque vous modifiez vos commentaires Javadoc: Ajouter un commentaire Javadoc: ...

Le choix des éditeurs

Les connexions cachées sur le Nikon D5600 - les nuls

Les connexions cachées sur le Nikon D5600 - les nuls

Ouvrent les couvercles sur les côtés gauche et droit du Nikon D5600 caméra, et vous verrez plusieurs ports de connexions cachées. Les ports de connexion suivants sont indiqués sur cette image: Terminal d'accessoires: ce terminal accepte les accessoires suivants: câble déclencheur à distance Nikon MC-DC2; Télécommandes sans fil WR-1 et WR-R10; et les unités GPS GP-1 / GP-1A. I ...

Les connexions cachées sur votre Nikon D5200 - les nuls

Les connexions cachées sur votre Nikon D5200 - les nuls

ÉParpillés sur l'extérieur de votre appareil photo sont nombreuses commandes que vous utilisez pour changer d'image -prend des paramètres, revoir et modifier vos photos, et effectuer diverses autres opérations. Caché sous le couvercle sur le côté gauche de la caméra, vous trouverez les quatre ports de connexion suivants, étiquetés dans cette figure: Borne accessoire: Vous pouvez brancher le Nikon en option ...

Des boutons et autres commandes du Nikon D7500 - mannequins

Des boutons et autres commandes du Nikon D7500 - mannequins

C'est génial d'avoir une carte pour le boutons et commandes sur votre appareil photo, mais ce n'est pas beaucoup d'aide si vous ne pouvez pas vous rappeler quel bouton appuyer sur quand (et pourquoi). Alors, voici un aperçu des fonctions des contrôles les plus importants. (Certains contrôles ont des fonctions supplémentaires pendant certaines opérations, mais la table ...

Insight Structuré
Requête: renvoie des données Exploration de données: Insight from structured data Unstructured
Recherche: renvoie des documents Analyse textuelle: Insight from text < Les technologies de gauche renvoient des informations et nécessitent une interaction humaine pour synthétiser et analyser cette information. Les technologies à droite - extraction de données et analyse de texte - fournissent des informations beaucoup plus rapidement. Heureusement, la valeur de l'analyse de texte pour votre organisation devient claire.