Construir una base de datos grande con el ecosistema Hadoop
Como componentes básicos, Hadoop MapReduce y HDFS son constantemente mejorados y proporcionan puntos de partida de los grandes datos, pero hay algo más. Tratando de hacer frente a grandes desafíos de datos sin una caja de herramientas llena de tecnología y servicios es como tratar de vaciar el océano con una cuchara. El ecosistema Hadoop ofrece una colección cada vez mayor de herramientas y tecnologías creadas para suavizar el desarrollo, implementación y soporte de soluciones de datos grandes.
Ningún edificio es estable, sin fundamento. Aunque es importante, la estabilidad no es el único criterio importante en un edificio. Cada parte del edificio debe ser compatible con su propósito general. Las paredes, pisos, escaleras, electricidad, plomería, y el techo deben complementarse entre sí mientras que confían en las bases de apoyo y la integración. Es lo mismo con el ecosistema Hadoop.
La fundación es MapReduce y HDFS. Ellos proporcionan los servicios básicos de estructura y de integración necesarias para apoyar los requisitos básicos de soluciones de datos grandes. El resto del ecosistema proporciona los componentes que necesita para construir y administrar aplicaciones de datos grandes, dirigidas a objetivos para el mundo real.
En ausencia del ecosistema sería incumbe a los desarrolladores, administradores de bases de datos, sistemas y administradores de redes y otros para identificar y ponerse de acuerdo sobre un conjunto de tecnologías para construir y desplegar soluciones de datos grandes. Esto es a menudo el caso cuando las empresas quieren adaptar nuevas y emergentes tendencias tecnológicas.
La tarea de improvisar tecnologías en un nuevo mercado es desalentadora. Es por ello que el ecosistema Hadoop es tan fundamental para el éxito de los grandes datos. Es la colección más completa de herramientas y tecnologías disponibles en la actualidad para orientar grandes desafíos de datos. El ecosistema de facilitar la creación de nuevas oportunidades para la adopción generalizada de grandes datos por empresas y organizaciones.