Table des matières:
- Attensity pour le big data
- Clarabridge pour le big data
- IBM pour le big data
- OpenText pour le Big Data
- SAS pour le big data
Vidéo: Présentation des méthodes de collecte et d’analyse de données dans l’évaluation d’impact 2024
Voici un aperçu de certains des acteurs du marché du big data d'analyse de texte. Certains sont petits tandis que d'autres sont des noms familiers. Certains appellent ce qu'ils font l'analyse de texte de données volumineuses , tandis que d'autres se contentent de l'appeler l'analyse de texte .
Attensity pour le big data
Attensity est l'une des sociétés d'analyse de texte originales qui a commencé à développer et vendre des produits il y a plus de dix ans. À ce jour, il compte plus de 150 clients d'entreprise et l'un des groupes de développement PNL les plus importants au monde. Attensity propose plusieurs moteurs pour l'analyse de texte. Ceux-ci incluent la classification automatique, l'extraction d'entité et l'extraction exhaustive. Exhaustive Extraction est la technologie phare d'Attensity qui extrait automatiquement les faits du texte analysé et organise cette information.
La société se concentre sur l'analyse et l'engagement sociaux et multicanaux en analysant le texte à partir de sources internes et externes, puis en l'acheminant vers les utilisateurs professionnels pour un engagement. Il a récemment acheté Biz360, une société de médias sociaux qui regroupe d'énormes flux de médias sociaux. Il a développé un système de calcul en grille qui fournit des capacités hautes performances pour le traitement de quantités massives de texte en temps réel.
Attensity utilise un framework Hadoop pour stocker des données. Il dispose également d'un système de mise en file d'attente des données qui crée un processus d'orchestration qui reconnaît les pics dans les données entrantes et ajuste le traitement sur plus ou moins de serveurs selon les besoins.
Clarabridge pour le big data
Clarabridge est un autre fournisseur de solutions d'analyse de texte pure, dérivé d'une société de conseil en intelligence d'affaires (Claraview) qui a compris la nécessité de traiter des données non structurées. Son objectif est d'aider les entreprises à générer une valeur commerciale mesurable en examinant le client de manière holistique, en identifiant les principales expériences et problèmes, et en aidant tout le monde dans une organisation à agir et à collaborer en temps réel.
Ceci inclut la détermination en temps réel du sentiment et la classification des données / du texte de la rétroaction des clients et la mise en scène du verbatim pour le traitement futur dans le système Clarabridge.
Actuellement, Clarabridge offre à ses clients des fonctionnalités sophistiquées et intéressantes, notamment l'analyse en un seul clic des causes premières pour identifier les changements qui affectent le volume de flux de texte, le sentiment ou la satisfaction associés aux problèmes émergents. Il offre également sa solution en tant que logiciel en tant que service (SaaS).
IBM pour le big data
Le géant du logiciel IBM propose plusieurs solutions dans le domaine de l'analyse de texte dans le cadre de sa stratégie Smarter Planet.Outre Watson et IBM SPSS, IBM propose également IBM Content Analytics avec Enterprise Search. IBM Content Analytics a été développé sur la base du travail effectué par IBM Research.
IBM Content Analytics est utilisé pour transformer le contenu en informations analysées. Il est disponible pour des analyses détaillées similaires à la manière dont les données structurées sont analysées dans un ensemble d'outils BI. IBM Content Analytics et Enterprise Search étaient autrefois deux produits distincts.
La solution convergée cible à la fois la recherche d'entreprise améliorée utilisant l'analyse textuelle et les besoins d'analyse de contenu autonome. L'ICAES est étroitement intégrée à la plate-forme IBM InfoSphere BigInsights, ce qui permet de réaliser de très grandes collectes de recherche et d'analyse de contenu.
OpenText pour le Big Data
OpenText, une entreprise canadienne, est probablement mieux connue pour son leadership dans les solutions de gestion de l'information d'entreprise. Sa vision s'articule autour de la gestion, de la sécurisation et de l'extraction de la valeur des données non structurées des entreprises. Il fournit ce qu'il appelle "middleware sémantique". "
Selon la société, l'évolution de sa technologie sémantique est fondée sur sa capacité" à permettre une analyse en temps réel avec une grande précision sur de grands ensembles de données à travers les langages, les formats et les domaines de l'industrie. "L'idée derrière le middleware sémantique est que la sémantique peut être exposée à différents niveaux et travailler avec différentes technologies pour résoudre les problèmes d'affaires.
En d'autres termes, l'analyse de texte peut être activée et utilisée si nécessaire.
SAS pour le big data
SAS résout depuis longtemps des problèmes complexes de big data. Il y a plusieurs années, il a acheté le fournisseur d'analyse textuelle Teragram pour améliorer sa stratégie d'utilisation de données structurées et non structurées dans l'analyse et pour intégrer ces données à la modélisation descriptive et prédictive. Désormais, ses fonctionnalités d'analyse de texte font partie de sa plate-forme d'analyse globale et les données textuelles sont considérées simplement comme une autre source de données.
SAS continue d'innover dans le domaine de l'analyse haute performance pour s'assurer que la performance répond aux attentes des clients. Le but est de prendre des problèmes qui prenaient des semaines pour les résoudre et les résoudre en quelques jours, ou des problèmes qui nécessitaient des jours pour les résoudre et les résoudre en quelques minutes.
Par exemple, le serveur SAS High Performance Analytics est une solution en mémoire qui vous permet de développer des modèles analytiques en utilisant des données complètes, et pas seulement un sous-ensemble de données agrégées. SAS dit que vous pouvez utiliser des milliers de variables et des millions de documents dans le cadre de cette analyse. La solution fonctionne sur les appliances EMC Greenplum ou Teradata, ainsi que sur le matériel de base à l'aide de Hadoop Distributed File System (HDFS).