Deja tus datos grande juntos

¿Cómo va a saber cómo poner todos los datos juntos? Con un proyecto de datos grande, lo que quiere hacer con sus datos estructurados y no estructurados indica por qué es posible elegir una pieza de tecnología sobre otra. También determina la necesidad de comprender las estructuras de datos entrantes para poner estos datos en el lugar correcto.

Manejo de diferentes tipos de datos para grandes datos

Usted tendrá que considerar algunas de las características de los grandes datos y los tipos de sistemas de gestión de datos es posible que desee utilizar para abordar cada una.

imagen0.jpg

Integrar los tipos de datos en un entorno de datos grande

Otro aspecto importante de grandes datos es que a menudo no es necesario poseer todos los datos que va a utilizar. Muchos ejemplos hacen el punto. Se le puede aprovechar los datos de medios sociales, los datos procedentes de las estadísticas de la industria de terceros, o incluso los datos procedentes de los satélites. Basta con pensar en los medios sociales y entenderás.

A menudo, se hace necesario integrar diferentes fuentes. Estos datos pueden venir de todos los sistemas internos, tanto de fuentes internas y externas, o de fuentes externas por completo. Muchos de estos datos pueden haber sido en silos antes.

Los datos no tienen por qué estar llegando a usted en tiempo real. Es posible que sólo tiene un montón de él y es dispar en la naturaleza. Esto todavía podría calificar como un problema de grandes datos. Por supuesto, también podría enfrentarse a un escenario en el que se está viendo enormes volúmenes de datos, a altas velocidades, y es dispar en la naturaleza.

El punto es que no obtendrá el valor de negocio si usted se ocupa de una variedad de fuentes de datos como un conjunto de silos desconectados de la información.

Componentes que necesita incluir conectores y metadatos.

Conectores

Usted quiere tener algunos conectores que permiten extraer datos desde varias fuentes de datos grandes. Tal vez usted quiere un conector Twitter o Facebook una. Tal vez usted necesita para integrar desde su almacén de datos con una fuente de datos grande que está fuera de sus instalaciones para que pueda analizar estas dos fuentes de datos en conjunto.

Metadatos

Un componente fundamental para la integración de todos estos datos son los metadatos. Metadatos se las definiciones, asignaciones y otras características utilizadas para describir cómo encontrar, acceder y utilizar los datos de una empresa (y software) componentes. Un ejemplo de metadatos son datos acerca de un número de cuenta. Esto podría incluir el número, descripción, tipo de datos, nombre, dirección, número de teléfono, y el nivel de privacidad.

Los metadatos se pueden utilizar para ayudarle a organizar sus almacenes de datos y hacer frente a las fuentes de datos nuevas y cambiantes. Aunque la idea de metadatos no es nuevo, está cambiando y evolucionando en el contexto de los grandes datos. En el mundo de metadatos tradicional, es importante contar con un catálogo que ofrece una visión única de todas las fuentes de datos.

Pero este catálogo tendrá que ser diferente cuando usted no controla todas estas fuentes de datos. Es posible que necesite una herramienta analítica que le ayudará a entender los metadatos subyacente.