Diferentes enfoques para el análisis de grandes datos

En muchos casos, el análisis de grandes datos estará representado al usuario final a través de informes y visualizaciones. Debido a que los datos en bruto pueden ser incomprensiblemente variada, usted tiene que confiar en las herramientas y técnicas de análisis para ayudar a presentar los datos de manera significativa.

Las nuevas aplicaciones se están disponibles y se caen en dos categorías: de encargo o semi-custom.

Las aplicaciones personalizadas para el análisis de grandes datos

En general, se crea una aplicación personalizada para un propósito específico o un conjunto relacionado de propósitos. Para el análisis de grandes datos, con el propósito de desarrollo de aplicaciones personalizadas es acelerar el momento de la decisión o acción.

Medio ambiente: R

los " R " medio ambiente se basa en la " S " estadísticas e idioma análisis desarrollado en la década de 1990 por los Laboratorios Bell. Es mantenido por el proyecto GNU y está disponible bajo la licencia GNU.

Mientras desafiando a comprender plenamente, su profundidad y flexibilidad lo convierten en una opción atractiva para los desarrolladores de aplicaciones de análisis y " # 148 usuarios avanzados.; Además, el proyecto CRAN R mantiene un conjunto mundial de servidores de protocolo y de la tela de transferencia de archivos con las versiones más arriba-hasta la fecha del entorno R. Un soporte comercial, versión empresarial de R también está disponible desde la revolución de Analytics.

Más específicamente, R es un conjunto integrado de herramientas de software y tecnologías diseñadas para crear aplicaciones personalizadas que se utilizan para facilitar la manipulación de datos, cálculo, análisis y presentación visual. Entre otras capacidades avanzadas, soporta

  • Componentes eficaces de manejo de datos y la manipulación.

  • Los operadores de los cálculos sobre matrices y otros tipos de datos ordenados.

  • Herramientas específicas para una amplia variedad de análisis de datos.

  • Capacidades de visualización avanzadas.

  • Lenguaje de programación S diseñado por los programadores, los programadores con muchas construcciones familiares, entre ellos condicionales, bucles, funciones recursivas definidos por el usuario, y una amplia gama de servicios de entrada y salida.

R es muy adecuado para un solo uso, aplicaciones personalizadas para el análisis de las fuentes de datos grandes.

Google Prediction API

La API de Predicción Google es un ejemplo de una clase emergente de grandes herramientas de aplicación de análisis de datos. Está disponible en el sitio web de los desarrolladores de Google y está bien documentado y dotado de varios mecanismos de acceso utilizando diferentes lenguajes de programación. Para ayudarle a empezar, que está disponible gratuitamente durante seis meses.

La API de predicción es bastante simple. Se busca patrones y los compara con los patrones existentes proscriptivas, prescriptivos, u otros. Durante la realización de su patrón de juego, sino que también " aprende ". Cuanto más lo uses, más inteligente se vuelve.

Predicción se implementa como una API REST con soporte de idiomas para .NET, Java, PHP, javascript, Python, Ruby, y muchos otros. Google también proporciona secuencias de comandos para acceder a la API, así como una biblioteca cliente para R.

Análisis predictivo es una de las más poderosas capacidades potenciales de los grandes datos y la API Predicción Google es una herramienta muy útil para crear aplicaciones personalizadas.

Aplicaciones semi-personalizados para el análisis de grandes datos

En verdad, lo que muchos perciben como aplicaciones personalizadas se crean en realidad usando " envasados ​​" o componentes de terceros como bibliotecas. No siempre es necesario codificar completamente una nueva aplicación. El uso de aplicaciones o componentes envasados ​​requiere desarrolladores o analistas de escribir código para " tejer juntos " estos componentes en una aplicación personalizada de trabajo. Las siguientes son razones por las que este es un enfoque de sonido:

  • Velocidad de despliegue: Debido a que usted no tiene que escribir cada parte de la aplicación, el tiempo de desarrollo puede ser reducido en gran medida.

  • Estabilidad: Usando bien construidas,, componentes fiables de terceros puede ayudar a hacer que la aplicación personalizada más resistente.

  • Mejor calidad: Componentes envasados ​​suelen ser objeto de mayores estándares de calidad, ya que se han desplegado en una gran variedad de entornos y dominios.

  • Más flexibilidad: Si un mejor componente viene, que se puede cambiar en la aplicación, que se extiende la vida útil, la capacidad de adaptación, y la utilidad de la aplicación personalizada.

Otro tipo de aplicación semi-custom es uno en el que el código fuente está disponible y se modifica para un propósito particular. Esto puede ser un enfoque eficaz porque hay un buen número de ejemplos de bloques de construcción de aplicaciones disponibles para incorporar en su aplicación semi-custom:

  • TA-Lib: La biblioteca de Análisis Técnico es ampliamente utilizado por los desarrolladores de software que necesitan para llevar a cabo el análisis técnico de los datos del mercado financiero. Está disponible como código abierto bajo la licencia BSD, lo que le permite ser integrado en aplicaciones semi-custom.

  • JUNG: El marco de Java universal Red Graph es una biblioteca que proporciona un marco común para el análisis y visualización de datos que puede ser representado por un gráfico o de la red. Es útil para el análisis de redes sociales, medidas de importancia, y la minería de datos. Está disponible como código abierto bajo la licencia BSD.

  • GeoTools: Un conjunto de herramientas geoespaciales de código abierto para la manipulación de datos de SIG en muchas formas, el análisis de atributos espaciales y no espaciales o datos GIS, y la creación de gráficos y redes de los datos. Está disponible bajo la licencia GPL2, lo que permite la integración en aplicaciones semi-custom.




» » » » Diferentes enfoques para el análisis de grandes datos