Herramientas de análisis de texto para datos grande

He aquí un resumen de algunos de los jugadores en el mercado de grandes volúmenes de datos de análisis de texto. Algunos son pequeños, mientras que otros son nombres muy conocidos. Algunos llaman a lo que hacen análisis de grandes volúmenes de datos de texto, mientras que algunos sólo se refieren a ella como El análisis de texto.

Video: Herramientas de Análisis de Mercados del ITC

Attensity de grandes volúmenes de datos

Attensity es una de las empresas de análisis de texto originales que se inició el desarrollo y venta de productos de más de diez años atrás. En este momento, tiene más de 150 clientes de la empresa y uno de los mayores grupos de desarrollo de la PNL del mundo. Attensity ofrece varios motores de análisis de texto. Estos incluyen Auto-Clasificación, Entidad de extracción y extracción exhaustiva. La extracción exhaustiva es la tecnología insignia de Attensity que extrae automáticamente hechos a partir del texto analizado y organiza esta información.

Video: Minería de texto y análisis de contenido con apoyo de QDA Miner y Worstat

La compañía se centra en análisis sociales y multicanal y el compromiso mediante el análisis de texto para la presentación de informes de fuentes internas y externas y luego encaminar a los usuarios de negocio para el compromiso. Recientemente, ha adquirido Biz360, una compañía de medios de comunicación social que agrupa a grandes flujos de medios de comunicación social. Se ha desarrollado un sistema de computación distribuida que proporciona capacidades de alto rendimiento para el procesamiento de grandes cantidades de texto en tiempo real.

Attensity utiliza un marco de Hadoop para almacenar datos. También cuenta con un sistema de gestión de colas de datos que crea un proceso de orquestación que reconoce los picos de los datos entrantes y ajusta procesamiento a través de más menos servidores / según sea necesario.

Video: El Comentario de Texto, una herramienta de(...)

Clarabridge de grandes volúmenes de datos

Otro vendedor de texto de análisis puro juego, Clarabridge en realidad es un spin-off de una empresa de consultoría de inteligencia empresarial (BI) (llamado Claraview) que se dio cuenta de la necesidad de hacer frente a los datos no estructurados. Su objetivo es ayudar a las empresas a impulsar el valor empresarial medible por mirar el cliente de manera integral, identificando experiencias y cuestiones clave, y ayudar a todos los miembros de una organización tomar acciones y colaborar en tiempo real.

Esto incluye la determinación en tiempo real del sentimiento y la clasificación de los comentarios de los clientes de datos / texto y puesta en escena del pie de la letra para su posterior procesamiento en el sistema Clarabridge.

En este momento, Clarabridge está ofreciendo a sus clientes algunas de las características sofisticadas e interesantes, incluyendo análisis de la causa raíz de un solo clic para identificar qué está causando un cambio en el volumen de texto alimenta, sentimiento, o la satisfacción asociada a los nuevos problemas. También ofrece su solución como un software como servicio (SaaS).

Video: Excel Avanzado 2010. Herramientas de análisis. Vídeo 14 Buscar Objetivo

IBM para grandes volúmenes de datos

El gigante del software IBM ofrece varias soluciones en el espacio de análisis de texto bajo su paraguas estrategia Smarter Planet. Aparte de Watson e IBM SPSS, IBM también ofrece IBM Content Analytics con la búsqueda empresarial. IBM Content Analytics fue desarrollado con base en el trabajo realizado de IBM Research.

IBM Content Analytics se utiliza para transformar el contenido en información analizada, y esto está disponible para un análisis detallado similar a la forma de datos estructurados serían analizados en un conjunto de herramientas de BI. IBM Content Analytics y búsqueda empresarial una vez dos productos por separado.

Los objetivos solución convergente tanto de búsqueda empresarial mejorada que utiliza el análisis de texto, así como las necesidades de análisis de contenido independiente. ICAES tiene una estrecha integración con la plataforma IBM InfoSphere BigInsights, permitiendo muy grandes colecciones de búsqueda y análisis de contenido.

OpenText para grandes volúmenes de datos

OpenText, una empresa con sede en Canadá, es probablemente mejor conocido por su liderazgo en soluciones de gestión de información empresarial. Su visión gira en torno a gestionar, asegurar y extraer valor de los datos no estructurados de las empresas. Se ofrece lo que denomina “middleware semántica.”

Según la compañía, la evolución de la tecnología semántica se basa en su capacidad “para permitir análisis en tiempo real con una alta precisión en grandes conjuntos de datos a través de lenguajes, formatos y dominios de la industria.” La idea detrás de middleware semántica es que la semántica pueden estar expuestos a diferentes niveles y trabajo con diferentes tecnologías para abordar las cuestiones de negocios.

En otras palabras, los análisis de texto se pueden activar y utilizar cuando sea necesario.

SAS para grandes volúmenes de datos

SAS ha sido la solución de complejos problemas de datos grandes durante mucho tiempo. Hace varios años, se compró el análisis de textos proveedor Teragram para mejorar su estrategia de utilizar los datos estructurados y no estructurados en el análisis y la integración de estos datos para el modelado descriptivo y predictivo. Ahora, sus capacidades de análisis de texto son parte de su plataforma de análisis general de los datos y el texto es visto simplemente como otra fuente de datos.

SAS continúa innovando en el área de análisis de alto rendimiento para asegurar que el resultado satisface las expectativas del cliente. El objetivo es tomar los problemas que solían llevar semanas para resolver y resolverlos en días, o problemas que solía tomar días para resolver y resolverlos en cuestión de minutos en lugar.

Por ejemplo, el SAS de alto rendimiento Analytics Server es una solución en memoria que le permite desarrollar modelos analíticos a partir de datos completos, no sólo un subconjunto de los datos agregados. SAS dice que puede utilizar miles de variables y millones de documentos como parte de este análisis. La solución se ejecuta en EMC Greenplum o aparatos de Teradata, así como en hardware utilizando Hadoop Distributed File System (HDFS).

Artículos Relacionados