Administrar la virtualización de datos grande
La virtualización separa los recursos y servicios del entorno subyacente entrega física, que le permite crear muchos sistemas virtuales en un único sistema físico. Una de las razones principales que las empresas han implementado la virtualización es mejorar el rendimiento y la eficiencia de procesamiento de una mezcla diversa de cargas de trabajo
Conteúdo
La gran hipervisor de datos
En un mundo ideal, usted no quiere preocuparse por el sistema operativo subyacente y el hardware físico. LA hipervisor es la tecnología responsable de garantizar que el intercambio de recursos se lleva a cabo de manera ordenada y repetible.
El hipervisor se sienta en los niveles más bajos del entorno de hardware y utiliza una fina capa de código para permitir el intercambio dinámico de recursos. El hipervisor hace parecer cada sistema operativo tiene los recursos físicos todos a sí mismo.
En el mundo de los grandes datos, puede que tenga que soportar muchos entornos operativos diferentes. El hipervisor se convierte en un mecanismo de entrega ideal para los componentes de la tecnología de la pila de datos grande. El hipervisor le permite mostrar la misma aplicación en una gran cantidad de sistemas sin tener que copiar físicamente que la aplicación en cada sistema.
Como beneficio adicional, debido a la arquitectura de hipervisor, puede cargar cualquier sistema operativo diferentes como si fueran simplemente otra aplicación. Así, el hipervisor es una forma muy práctica de hacer las cosas virtualizados de forma rápida y eficiente.
Los sistemas operativos invitados son los sistemas operativos que se ejecutan en las máquinas virtuales. Con la tecnología de virtualización, puede configurar el hipervisor para dividir los recursos del equipo físico. Los recursos pueden ser divididos 50/50 o 80/20 entre dos sistemas operativos invitados, por ejemplo.
La belleza de este arreglo es que el hipervisor hace todo el trabajo pesado. El sistema operativo invitado no le importa que se está ejecutando en un partition- virtuales que piensa que tiene una computadora todo a sí mismo.
Usted encuentra básicamente dos tipos de hipervisores:
Escriba 1 hipervisores ejecutar directamente en la plataforma de hardware. Alcanzan una mayor eficiencia porque están corriendo directamente en la plataforma.
Escriba 2 hipervisores ejecutarse en el sistema operativo host. A menudo se utilizan cuando existe una necesidad de apoyar una amplia gama de dispositivos de E / S.
Abstracción y big data virtualización
Para los recursos y servicios de TI para ser virtualizada, que están separados del entorno subyacente entrega física. El término de este acto de separación se llama abstracción. La abstracción es un concepto clave en los grandes datos. MapReduce Hadoop y se distribuyen entornos de computación en el que todo se abstrae. El detalle se abstrae a cabo para que el desarrollador o analista no tiene que preocuparse de donde se encuentran los elementos de datos.
Abstracción minimiza la complejidad de algo ocultando los detalles y proporcionar sólo la información relevante. Por ejemplo, si se va a recoger a alguien que nunca has visto antes, se le puede decir la ubicación a su encuentro, y lo que se lleva. Él no necesita que le diga que lo vio nacer, la cantidad de dinero que tiene en el banco, su fecha de nacimiento, y así sucesivamente.
Esa es la idea con la abstracción - se trata de proporcionar una especificación de alto nivel en lugar de entrar en muchos detalles sobre cómo funciona algo.
Implementar la virtualización para trabajar con grandes datos
La virtualización ayuda a que su entorno de TI lo suficientemente inteligente como para manejar el análisis de datos grande. Mediante la optimización de todos los elementos de su infraestructura, incluyendo hardware, software y almacenamiento, se gana la eficiencia necesaria para procesar y gestionar grandes volúmenes de datos estructurados y no estructurados. Con grandes datos, es necesario acceder, gestionar y analizar datos estructurados y no estructurados en un entorno distribuido.
Big Data asume distribución. En la práctica, cualquier tipo de MapReduce funcionará mejor en un entorno virtualizado. Usted necesita la capacidad de mover cargas de trabajo de alrededor basada en los requisitos para la energía y el almacenamiento de cómputo.
La virtualización le permitirá hacer frente a los problemas más grandes que aún no han sido de ámbito. Usted no puede saber de antemano lo rápido que se necesita para escalar.
La virtualización le permitirá apoyar una variedad de grandes almacenes de datos operacionales. Por ejemplo, una base de datos gráfica se puede girar como una imagen.
El beneficio más directo de la virtualización es asegurarse de que los motores de MapReduce funcionen mejor. La virtualización se traducirá en una mejor escala y rendimiento para MapReduce. Cada uno de los Mapas y reducir las tareas tiene que ser ejecutado de forma independiente. Si el motor MapReduce es paralelizado y configurado para funcionar en un entorno virtual, usted puede reducir los gastos de gestión y permitir expansiones y contracciones en las cargas de trabajo de tareas.
Sí MapReduce es inherentemente paralelo y distribuido. Al encapsular el motor MapReduce en un contenedor virtual, puede ejecutar lo que necesita cuando lo necesite. Con la virtualización, a aumentar su utilización de los activos que ya ha pagado, al convertirlos en piscinas genéricas de los recursos.