Gestión de datos para grandes datos
Es el big data realmente nuevo o se trata de una evolución en la jornada de gestión de datos? En realidad, es ambas cosas. Al igual que con otras ondas en la gestión de datos, los datos grande está construido en la cima de la evolución de las prácticas de gestión de datos a través de las últimas cinco décadas. Lo que es nuevo es que, por primera vez, el costo de los ciclos y de almacenamiento de computación ha alcanzado un punto de inflexión. ¿Porque es esto importante?
Hace sólo unos años, las organizaciones suelen comprometerían mediante el almacenamiento de instantáneas o subconjuntos de información importante debido a que el costo de almacenamiento y procesamiento limitaciones les prohíbe almacenar todo lo que querían analizar.
En muchas situaciones, este compromiso funcionaba bien. Por ejemplo, una empresa de fabricación podría haber recogido datos de la máquina cada dos minutos para determinar la salud de los sistemas. Sin embargo, puede haber situaciones en las que la instantánea no contendría información sobre un nuevo tipo de defecto y que podría pasar desapercibidos durante meses.
Con grandes datos, ahora es posible para virtualizar datos de manera que se puede almacenar de manera eficiente y, utilizando de almacenamiento basado en la nube, de forma más rentable también. Además, las mejoras en la velocidad y la fiabilidad de la red han eliminado otras limitaciones físicas de ser capaz de manejar grandes cantidades de datos a un ritmo aceptable.
Añadir a esto el impacto de los cambios en el precio y la sofisticación de la memoria del ordenador. Con todas estas transiciones tecnológicas, ahora es posible imaginar formas en que las empresas pueden aprovechar los datos que hubiera sido inconcebible hace sólo cinco años.
Pero sin transición de la tecnología pasa en aislamiento- ocurre cuando existe una necesidad importante que pueden ser satisfechas por la disponibilidad y la maduración de la tecnología. Muchas de las tecnologías en el corazón de los grandes datos, tales como la virtualización, el procesamiento en paralelo, los sistemas de archivos distribuidos y bases de datos en memoria, han existido por décadas.
Análisis avanzados también han existido por décadas, a pesar de que no siempre han sido práctico. Otras tecnologías como Hadoop y MapReduce han estado en la escena por sólo unos pocos años. Esta combinación de la tecnología avanza ahora puede abordar los problemas de negocio significativas. Las empresas quieren ser capaces de obtener conocimientos y resultados de acciones concretas de muchos tipos diferentes de datos a la velocidad adecuada.
Si las empresas pueden analizar petabytes de datos (equivalentes a 20 millones de archivadores de cuatro cajones llenos de archivos de texto o 13,3 años de contenidos para televisión de alta definición) con un rendimiento aceptable para discernir patrones y anomalías, las empresas pueden empezar a dar sentido a los datos de nuevas maneras. El paso a los grandes datos, no se trata sólo de negocios.
Actividades científicas, de investigación, y gubernamentales también han contribuido a impulsar hacia adelante. Basta con pensar en el análisis del genoma humano o la negociación con todos los datos astronómicos recogidos en los observatorios para avanzar en nuestra comprensión del mundo que nos rodea. Considere la cantidad de datos que el gobierno recauda en sus actividades antiterroristas, así, y usted tiene la idea de que los grandes datos no sólo se trata de negocios.
Existen diferentes enfoques para el manejo de datos. Los datos en movimiento se utilizarían si una empresa es capaz de analizar la calidad de sus productos durante el proceso de fabricación para evitar errores costosos. Los datos en reposo serían utilizados por un analista de negocios para comprender mejor los patrones de compra de los clientes actuales con base en todos los aspectos de la relación con el cliente, incluyendo ventas, datos de los medios sociales y las interacciones de servicio al cliente.
Tenga en cuenta que las empresas se encuentran todavía en una fase inicial de aprovechar grandes volúmenes de datos para obtener una vista de 360 grados del negocio y anticipar los cambios y los cambios en las expectativas del cliente. Las tecnologías necesarias para obtener las respuestas a las necesidades de negocio siguen aislados unos de otros.
Big Data no es simplemente de una herramienta o una sola tecnología. Se trata de cómo todas estas tecnologías se unen para dar a las ideas correctas, en el momento adecuado, con base en los datos correctos - si es generado por las personas, máquinas o la web.