Herramientas de análisis de texto para grandes datos
He aquí un resumen de algunos de los jugadores en el mercado de grandes datos de análisis de texto. Algunos son pequeños, mientras que otros son nombres muy conocidos. Algunos llaman a lo que hacen grandes análisis de texto de datos
Conteúdo
Attensity para grandes datos
Attensity es una de las empresas originales de análisis de texto que se inició el desarrollo y venta de productos de más de diez años atrás. En este momento, cuenta con más de 150 clientes de la empresa y uno de los grupos de desarrollo PNL más grandes del mundo. Attensity ofrece varios motores de análisis de texto. Estos incluyen Auto-Clasificación, Entidad extracción y extracción exhaustiva. Extracción exhaustiva es la tecnología del buque insignia de Attensity que extrae automáticamente hechos del texto analizado y organiza esta información.
La compañía se centra en análisis sociales y multicanal y la participación mediante el análisis de texto para la presentación de informes a partir de fuentes internas y externas y luego de enrutamiento a los usuarios de negocio para el compromiso. Recientemente compró Biz360, una compañía de medios de comunicación social que agrega enormes flujos de medios de comunicación social. Se ha desarrollado un sistema de grid computing que proporciona capacidades de alto rendimiento para el procesamiento de grandes cantidades de texto en tiempo real.
Attensity utiliza un marco Hadoop para almacenar datos. También cuenta con un sistema de datos-cola que crea un proceso de orquestación que reconoce los picos en los datos entrantes y ajusta procesamiento a través de más / menos servidores según sea necesario.
Clarabridge para grandes datos
Otra pure-play análisis de texto vendedor, Clarabridge en realidad es un spin-off de la inteligencia de negocio (BI) consultora (llamado Claraview) que se dio cuenta de la necesidad de hacer frente a los datos no estructurados. Su objetivo es ayudar a las compañías a valor empresarial medible observando el cliente de manera integral, identificando experiencias y temas clave, y ayudar a todos los miembros de una organización tomar acciones y colaborar en tiempo real.
Esto incluye la determinación en tiempo real del sentimiento y la clasificación de los comentarios de los clientes de datos / texto y puesta en escena del pie de la letra para el procesamiento futuro en el sistema Clarabridge.
En este momento, Clarabridge está ofreciendo a sus clientes algunas de las características sofisticadas e interesantes, incluyendo un solo clic causa raíz análisis para identificar lo que está causando un cambio en el volumen de texto alimenta, sentimiento, o la satisfacción asociada a problemas emergentes. También ofrece su solución como un software como servicio (SaaS).
IBM para grandes datos
El gigante del software IBM ofrece varias soluciones en el espacio de análisis de texto bajo su paraguas estrategia Smarter Planet. Aparte de Watson e IBM SPSS, IBM también ofrece IBM Content Analytics con Enterprise Search. IBM Content Analytics fue desarrollado con base en el trabajo realizado de IBM Research.
IBM Content Analytics se utiliza para transformar el contenido en información analizada, y esto está disponible para su análisis detallado similar a la forma en que los datos estructurados se analizarían en un conjunto de herramientas de BI. IBM Content Analytics y Enterprise Search vez fueron dos productos distintos.
Los objetivos de soluciones convergentes tanto mejorada de búsqueda empresarial que utiliza el análisis de texto, así como de análisis de contenido de las necesidades de autónomos. ICAES tiene una estrecha integración con la plataforma InfoSphere BigInsights IBM, que permite la búsqueda y análisis de contenido muy grandes colecciones.
OpenText para grandes datos
OpenText, una empresa con sede en Canadá, es probablemente mejor conocido por su liderazgo en soluciones de gestión de la información de la empresa. Su visión gira en torno a la gestión, asegurar y extraer valor de los datos no estructurados de las empresas. Proporciona lo que denomina " middleware semántica ".
Según la compañía, su semántica evolución de la tecnología se basa en su capacidad " para permitir análisis en tiempo real con una alta precisión en grandes conjuntos de datos a través de lenguajes, formatos y dominios de la industria ". La idea detrás de middleware semántica es que la semántica pueden estar expuestos a diferentes niveles y trabajar con diferentes tecnologías para abordar las cuestiones de negocios.
En otras palabras, los análisis de texto se pueden habilitar y utilizar cuando sea necesario.
SAS para grandes datos
SAS ha sido resolver complejos problemas de datos grandes durante mucho tiempo. Hace varios años, compró proveedor análisis de texto Teragram para mejorar su estrategia de utilizar los datos estructurados y no estructurados en el análisis y la integración de estos datos para la modelización descriptiva y predictiva. Ahora, sus capacidades de análisis de texto son parte de su plataforma y un texto de análisis de datos en general es visto simplemente como otra fuente de datos.
SAS continúa innovando en el área de análisis de alto rendimiento para asegurar que el rendimiento cumple con las expectativas del cliente. El objetivo es tomar los problemas que solían tardar semanas para resolver y resolverlos en día, o problemas que solía tomar días para resolver y resolverlos en cuestión de minutos en lugar.
Por ejemplo, el SAS High Performance Analytics Server es una solución en memoria que le permite desarrollar modelos analíticos utilizando datos completos, no sólo un subconjunto de los datos agregados. SAS dice que puede utilizar miles de variables y millones de documentos como parte de este análisis. La solución se ejecuta en EMC Greenplum o aparatos de Teradata, así como en hardware utilizando Sistema de archivos distribuido Hadoop (HDFS).