Administrar la virtualización de datos grande

La virtualización separa los recursos y servicios del entorno subyacente entrega física, que le permite crear muchos sistemas virtuales en un único sistema físico. Una de las razones principales que las empresas han implementado la virtualización es mejorar el rendimiento y la eficiencia de procesamiento de una mezcla diversa de cargas de trabajo

Conteúdo

La gran hipervisor de datos
Abstracción y big data virtualización
Implementar la virtualización para trabajar con grandes datos

La gran hipervisor de datos

En un mundo ideal, usted no quiere preocuparse por el sistema operativo subyacente y el hardware físico. LA hipervisor es la tecnología responsable de garantizar que el intercambio de recursos se lleva a cabo de manera ordenada y repetible.

El hipervisor se sienta en los niveles más bajos del entorno de hardware y utiliza una fina capa de código para permitir el intercambio dinámico de recursos. El hipervisor hace parecer cada sistema operativo tiene los recursos físicos todos a sí mismo.

En el mundo de los grandes datos, puede que tenga que soportar muchos entornos operativos diferentes. El hipervisor se convierte en un mecanismo de entrega ideal para los componentes de la tecnología de la pila de datos grande. El hipervisor le permite mostrar la misma aplicación en una gran cantidad de sistemas sin tener que copiar físicamente que la aplicación en cada sistema.

Como beneficio adicional, debido a la arquitectura de hipervisor, puede cargar cualquier sistema operativo diferentes como si fueran simplemente otra aplicación. Así, el hipervisor es una forma muy práctica de hacer las cosas virtualizados de forma rápida y eficiente.

Los sistemas operativos invitados son los sistemas operativos que se ejecutan en las máquinas virtuales. Con la tecnología de virtualización, puede configurar el hipervisor para dividir los recursos del equipo físico. Los recursos pueden ser divididos 50/50 o 80/20 entre dos sistemas operativos invitados, por ejemplo.

La belleza de este arreglo es que el hipervisor hace todo el trabajo pesado. El sistema operativo invitado no le importa que se está ejecutando en un partition- virtuales que piensa que tiene una computadora todo a sí mismo.

Usted encuentra básicamente dos tipos de hipervisores:

Escriba 1 hipervisores ejecutar directamente en la plataforma de hardware. Alcanzan una mayor eficiencia porque están corriendo directamente en la plataforma.
Escriba 2 hipervisores ejecutarse en el sistema operativo host. A menudo se utilizan cuando existe una necesidad de apoyar una amplia gama de dispositivos de E / S.

Abstracción y big data virtualización

Para los recursos y servicios de TI para ser virtualizada, que están separados del entorno subyacente entrega física. El término de este acto de separación se llama abstracción. La abstracción es un concepto clave en los grandes datos. MapReduce Hadoop y se distribuyen entornos de computación en el que todo se abstrae. El detalle se abstrae a cabo para que el desarrollador o analista no tiene que preocuparse de donde se encuentran los elementos de datos.

Abstracción minimiza la complejidad de algo ocultando los detalles y proporcionar sólo la información relevante. Por ejemplo, si se va a recoger a alguien que nunca has visto antes, se le puede decir la ubicación a su encuentro, y lo que se lleva. Él no necesita que le diga que lo vio nacer, la cantidad de dinero que tiene en el banco, su fecha de nacimiento, y así sucesivamente.

Esa es la idea con la abstracción - se trata de proporcionar una especificación de alto nivel en lugar de entrar en muchos detalles sobre cómo funciona algo.

Implementar la virtualización para trabajar con grandes datos

La virtualización ayuda a que su entorno de TI lo suficientemente inteligente como para manejar el análisis de datos grande. Mediante la optimización de todos los elementos de su infraestructura, incluyendo hardware, software y almacenamiento, se gana la eficiencia necesaria para procesar y gestionar grandes volúmenes de datos estructurados y no estructurados. Con grandes datos, es necesario acceder, gestionar y analizar datos estructurados y no estructurados en un entorno distribuido.

Big Data asume distribución. En la práctica, cualquier tipo de MapReduce funcionará mejor en un entorno virtualizado. Usted necesita la capacidad de mover cargas de trabajo de alrededor basada en los requisitos para la energía y el almacenamiento de cómputo.

La virtualización le permitirá hacer frente a los problemas más grandes que aún no han sido de ámbito. Usted no puede saber de antemano lo rápido que se necesita para escalar.

La virtualización le permitirá apoyar una variedad de grandes almacenes de datos operacionales. Por ejemplo, una base de datos gráfica se puede girar como una imagen.

El beneficio más directo de la virtualización es asegurarse de que los motores de MapReduce funcionen mejor. La virtualización se traducirá en una mejor escala y rendimiento para MapReduce. Cada uno de los Mapas y reducir las tareas tiene que ser ejecutado de forma independiente. Si el motor MapReduce es paralelizado y configurado para funcionar en un entorno virtual, usted puede reducir los gastos de gestión y permitir expansiones y contracciones en las cargas de trabajo de tareas.

Sí MapReduce es inherentemente paralelo y distribuido. Al encapsular el motor MapReduce en un contenedor virtual, puede ejecutar lo que necesita cuando lo necesite. Con la virtualización, a aumentar su utilización de los activos que ya ha pagado, al convertirlos en piscinas genéricas de los recursos.

Sobre el autor

Cómo usar un hipervisor de virtualización en la nube de computación

LA hipervisor es un sistema operativo, lo que significa que sabe cómo actuar como un policía de tráfico para hacer que las cosas sucedan de una manera ordenada. El hipervisor se encuentra en los niveles más bajos del entorno de hardware. Debido…

Cómo virtualización complica la gestión de una nube híbrida

Un reto importante en la gestión de las nubes híbridas en la computación en nube es la necesidad de coordinar la gestión de los entornos virtuales y físicos. Virtualización es el proceso de separando los recursos y servicios del entorno…

Cloud híbrido para dummies

Un modelo de computación híbrida permite a una organización para aprovechar tanto los servicios informáticos públicos y privados para crear una utilidad más flexible y rentable de computación:los nube pública es un conjunto de hardware,…

Elementos fundamentales en la nube híbrida

La nube híbrida requiere elementos fundamentales para hacer un trabajo de modelo híbrido en el mundo real. Aunque hay muchas cuestiones y consideraciones técnicas al utilizar la nube híbrida, la comprensión de los siguientes elementos es…

La gestión de la virtualización en entornos cloud híbridos

En un entorno de nube híbrida virtualizado, usted tendrá una gran cantidad de piezas individuales de manejar. Usted tendrá que tratar a todos los recursos juntos como si fueran un solo sistema, en lugar de una imagen aquí o allí. Si no lo hace,…

Las cuestiones de seguridad con la virtualización de la computación en nube

El uso de las máquinas virtuales de TI complica la seguridad en una gran forma para ambas empresas que ejecutan los proveedores de cloud computing y servicios privados. La virtualización cambia la definición de lo que es un servidor, por lo que…

Factores de forma de implementación alternativos para hadoop

Aunque Hadoop funciona mejor cuando está instalado en un equipo físico, cuando el tratamiento tiene acceso directo al almacenamiento dedicado y redes, Hadoop tiene implementaciones alternativas. Y a pesar de que son menos eficientes que el…

Administrar los recursos de datos grandes y aplicaciones con hilo hadoop

Planificación de tareas y seguimiento de los grandes datos son partes integrales de Hadoop MapReduce y se pueden usar para administrar los recursos y aplicaciones. Las primeras versiones de Hadoop apoyaron un sistema de seguimiento de trabajos y…

La gestión de grandes datos con Hadoop HDFS y MapReduce:

Hadoop, un marco de software de código abierto, utiliza HDFS (el sistema de archivos distribuido Hadoop) y MapReduce para analizar grandes volúmenes de datos en clústeres de hardware que la mercancía es, en un entorno de computación…

Grandes bases de virtualización de datos

La virtualización es ideal para grandes volúmenes de datos, ya que separa los recursos y servicios del entorno subyacente entrega física, que le permite crear muchos sistemas virtuales en un único sistema físico. Una de las razones principales…

Capa 3 de la pila de datos grande: la organización de los servicios y herramientas de datos

La organización de los servicios de datos y herramientas, la capa 3 de la pila de datos grande, capturar, validar, y montar varios elementos de datos grandes en colecciones contextualmente relevantes. Dado que los datos de grande es masiva, las…

Desafíos de la virtualización de datos grande

Entornos de grandes volúmenes de datos virtualizados deben ser gestionados de manera adecuada y se rige a darse cuenta de ahorro de costes y beneficios de eficiencia. Si usted confía en los servicios de datos grandes para resolver sus retos de…

maniqui-es.com » Computadoras y software » Big Data » Ingeniería » Administrar la virtualización de datos grande