La evolución de la computación distribuida para grandes datos

Detrás de todas las tendencias importantes en la última década, incluyendo la orientación al servicio, la computación en nube, virtualización y big data, es una tecnología fundamental llamada computación distribuida.

Conteúdo

Darpa y datos grande
El valor de un modelo de datos de gran coherente

En pocas palabras, sin distribuir la computación, ninguno de estos avances sería posible.

La computación distribuida es una técnica que permite a los ordenadores individuales sean conectados en red a través de áreas geográficas como si fueran un único entorno. Usted encontrará muchas implementaciones diferentes de la computación distribuida. En algunas topologías, las entidades individuales computing simplemente pasan mensajes entre sí.

En otras situaciones, un entorno informático distribuido podrá compartir recursos que van desde la memoria a las redes y almacenamiento. Todos los modelos de computación distribuida tienen un atributo común: Son un grupo de ordenadores en red que trabajan juntos para ejecutar una carga de trabajo o proceso.

DARPA y datos grande

El modelo de computación distribuida más conocida, la Internet, es la base de todo, desde el comercio electrónico para la computación en nube para la gestión del servicio y la virtualización. El Internet fue concebido como un proyecto de investigación financiado por los EE.UU. DARPA.

Fue diseñado para crear un sistema de redes de interconexión que apoyaría no comercial, colabore investigación entre los científicos. En los primeros días de la Internet, estos equipos a menudo se conectan mediante líneas telefónicas! A menos que usted experimentó esa frustración, sólo se puede imaginar lo lentos y frágiles esas conexiones eran.

A medida que la tecnología maduró durante la próxima década, los protocolos comunes como Transmission Control Protocol (TCP) ayudaron a proliferar la tecnología y la red. Cuando se añadió el Protocolo de Internet (IP), el proyecto pasó de una red cerrada para una colección de científicos a una plataforma potencialmente comercial para transferir el correo electrónico en todo el mundo.

A lo largo de la década de 1980, los servicios nuevos basados en Internet comenzaron a surgir en el mercado como una alternativa comercial a la red DARPA. En 1992, el Congreso de Estados Unidos aprobó la Ley de Ciencia y Tecnología Avanzada-que, por primera vez, permite un uso comercial de esta poderosa tecnología de redes. Con continuado su crecimiento explosivo, Internet es realmente una red distribuida mundial y sigue siendo el mejor ejemplo del poder de la computación distribuida.

El valor de un modelo de datos de gran coherente

¿Qué diferencia este esfuerzo liderado por DARPA crea en el movimiento para la computación distribuida? Antes de la comercialización del Internet, había cientos de empresas y organizaciones que crean una infraestructura de software destinado a proporcionar una plataforma común para apoyar un entorno de computación altamente distribuida.

Sin embargo, cada proveedor o estándares de la organización surgió con sus propias llamadas de procedimientos remotos (RPC) que todos los clientes, desarrolladores de software comercial, y socios tendrían que adoptar y apoyo. RPC es un mecanismo primitivo utilizado para enviar el trabajo a un equipo remoto y por lo general requiere de espera para el trabajo a distancia para completar antes puede continuar otros trabajos.

Con los proveedores de ejecución de RPC de propiedad, se hizo impracticable imaginar que cualquier empresa sería capaz de crear un estándar universal para la computación distribuida. A mediados de la década de 1990, los protocolos de Internet reemplazan estos planteamientos primitivos y se convirtieron en la base para lo que está distribuida la computación hoy en día. Después de esto se resolvió, los usos de este enfoque de la computación en red comenzaron a florecer.

Sobre el autor

¿Cómo evaluar el costo de una nube privada en la computación en nube

¿Cuáles son su centro de datos de computación en nube privada y operaciones de TI en realidad le cuesta? No es una pregunta fácil de responder. La mayoría de las empresas se dividen el área de gastos de TI en dos cubos:Los gastos de capital se…

Introducción a la computación en nube para redes

La idea básica detrás de la computación en nube es externalizar una o más de sus recursos informáticos conectados en red a Internet. " La nube " representa una nueva manera de manejar las tareas comunes de equipo. Los siguientes son algunos…

La gestión de los recursos de computación en nube

En teoría, los recursos basadas en servicios de computación en nube no debería ser diferente de los recursos en su propio entorno, salvo que viven de forma remota. Lo ideal es que se tiene una vista completa de los recursos de computación en…

Las nubes públicas frente a las nubes privadas para las redes de ordenadores

La forma más común de la computación en nube para las redes utiliza lo que se conoce como un nube pública - es decir, servicios en la nube que están disponibles para cualquier persona en el mundo a través de Internet. Google Apps es un…

El alquiler de la infraestructura en la computación en nube

Infraestructura como Servicio (IaaS) es la entrega de equipos informáticos (servidores, tecnología de redes, almacenamiento y espacio del centro de datos) como un servicio. También se puede esperar para incluir la entrega de los sistemas…

Integración orientada a servicios en un entorno de nube híbrida

Empresas grandes y pequeñas a menudo usan una combinación de servicios de nubes públicas y privadas que operan en conjunto en un entorno híbrido. Este tipo de entorno híbrido se convertirá en las empresas de forma estándar ejecutarlo en el…

La gestión de grandes datos con Hadoop HDFS y MapReduce:

Hadoop, un marco de software de código abierto, utiliza HDFS (el sistema de archivos distribuido Hadoop) y MapReduce para analizar grandes volúmenes de datos en clústeres de hardware que la mercancía es, en un entorno de computación…

Modelos de despliegue en la nube de datos grandes

Dos modelos clave en la nube son importantes en la discusión de los grandes datos - nubes públicas y nubes privadas. Computación en la nube es un método para proporcionar un conjunto de recursos informáticos compartidos que incluyen…

Grandes bases de virtualización de datos

La virtualización es ideal para grandes volúmenes de datos, ya que separa los recursos y servicios del entorno subyacente entrega física, que le permite crear muchos sistemas virtuales en un único sistema físico. Una de las razones principales…

Conceptos básicos de computación distribuida para grandes datos

Si su empresa está considerando un proyecto de datos grande, es importante que usted entienda algunos conceptos básicos de computación distribuida primero. No hay un modelo de computación distribuida solo porque los recursos informáticos se…

La nube en el contexto de grandes datos

Computación en la nube es un método para proporcionar un conjunto de recursos informáticos compartidos y se está convirtiendo cada vez más importante para su iniciativa de datos grande. La nube incluye aplicaciones, computación,…

Rendimiento y grandes datos

Simplemente tener un equipo más rápido no es suficiente para garantizar el nivel adecuado de rendimiento para manejar grandes volúmenes de datos. ¡Tienes que ser capaz de distribuir los componentes de su servicio de datos grande a través de una…

maniqui-es.com » Computadoras y software » Big Data » Ingeniería » La evolución de la computación distribuida para grandes datos