Vidéo: Analysez vos données textuelles avec SAS® Text Analytics 2024
De nombreuses méthodes existent pour analyser les données non structurées pour votre initiative Big Data. Historiquement, ces techniques sont issues de domaines techniques tels que le traitement du langage naturel (NLP), la découverte de connaissances, l'exploration de données, la recherche d'informations et les statistiques. L'analyse de texte consiste à analyser le texte non structuré, à extraire des informations pertinentes et à les transformer en informations structurées pouvant être exploitées de différentes manières.
Les processus d'analyse et d'extraction tirent parti des techniques issues de la linguistique computationnelle, des statistiques et d'autres disciplines de l'informatique.
Parfois, un exemple peut aider à expliquer un sujet complexe. Supposons que vous travaillez pour le département marketing dans une entreprise de téléphonie sans fil. Vous venez de lancer deux nouveaux plans d'appel - Plan A et Plan B - et vous n'obtenez pas l'adhésion souhaitée sur le Plan A. Le texte non structuré provenant des notes du centre d'appels peut vous donner un aperçu de la raison pour laquelle cela s'est produit.
Les mots soulignés fournissent l'information dont vous pourriez avoir besoin pour comprendre pourquoi le plan A ne gagne pas une adoption rapide. Par exemple, l'entité Plan A apparaît dans toutes les notes du centre d'appels, indiquant que les rapports mentionnent le plan.
Les termes minutes de transfert, données 4 Go, plan de données, et coûteux sont la preuve qu'il existe un problème avec les minutes de transfert, le plan de données et le prix. Des mots comme ridicule et stupide donnent un aperçu du sentiment de l'appelant, qui dans ce cas est négatif.
Le processus d'analyse de texte utilise divers algorithmes, tels que la compréhension de la structure des phrases, pour analyser le texte non structuré, puis extraire des informations et transformer ces informations en données structurées. Les données structurées extraites du texte non structuré sont illustrées dans le Tableau 13-1.
Identifiant | Entité | Problème | Sentiment |
---|---|---|---|
Cust XYZ | Plan A | minutes de retournement | Neutre |
Cust ABC | Plan A | Renvoi des minutes | Négatif |
XXXX | Plan A | Cher | Neutre |
XXXX | Plan A | Plan de données | Neutre |
Cust XYT > Plan A | Plan de données | Négatif | Vous pouvez regarder ceci et dire: «Mais j'aurais pu le comprendre en regardant les dossiers du centre d'appels. "Cependant, ce ne sont là qu'un petit sous-ensemble de l'information enregistrée par des milliers d'agents du centre d'appels. Chaque agent individuel ne peut pas détecter une tendance générale concernant le problème avec chaque plan offert par l'entreprise. |
Les agents n'ont pas le temps ou l'obligation de partager ces informations avec tous les autres agents du centre d'appels susceptibles d'obtenir le même nombre d'appels concernant le plan A. Toutefois, après que ces informations ont été agrégées et traitées à l'aide d'algorithmes d'analyse textuelle peut émerger de ces données non structurées. C'est ce qui rend l'analyse de texte si puissante.
La recherche consiste à récupérer un document en fonction de ce que les utilisateurs finaux savent déjà qu'ils recherchent. L'analyse de texte consiste à découvrir des informations. Bien que l'analyse de texte diffère de la recherche, elle peut augmenter les techniques de recherche. Par exemple, l'analyse de texte combinée à la recherche peut être utilisée pour mieux classer ou classifier des documents et pour produire des résumés ou des résumés de documents.
Il existe quatre technologies: la requête, l'exploration de données, la recherche et l'analyse de texte. Sur le côté gauche de la table sont query et search, qui sont tous les deux sur la récupération. Par exemple, un utilisateur final peut interroger une base de données pour savoir combien de clients ont cessé d'utiliser les services de l'entreprise au cours du dernier mois.
La requête retournera un seul nombre. Ce n'est qu'en demandant des requêtes plus nombreuses et différentes que l'utilisateur final obtiendra les informations nécessaires pour déterminer pourquoi les clients partent. De même, la recherche par mot-clé permet à l'utilisateur final de trouver les documents qui contiennent les noms des concurrents d'une entreprise. La recherche retournerait un groupe de documents. Ce n'est qu'en lisant les documents que l'utilisateur final trouverait des réponses pertinentes.
Récupération
Insight | Structuré | |
---|---|---|
Requête: renvoie des données | Exploration de données: Insight from structured data | Unstructured |
Recherche: renvoie des documents | Analyse textuelle: Insight from text < Les technologies de gauche renvoient des informations et nécessitent une interaction humaine pour synthétiser et analyser cette information. Les technologies à droite - extraction de données et analyse de texte - fournissent des informations beaucoup plus rapidement. Heureusement, la valeur de l'analyse de texte pour votre organisation devient claire. |