Apache bigtop y Hadoop

Para ayudarle a empezar con Hadoop, aquí están las instrucciones sobre cómo descargar e instalar rápidamente Hadoop en su propio ordenador portátil. El clúster se ejecuta en modo pseudo-distribuido en una máquina virtual, por lo que no necesitará hardware especial.

LA máquina virtual (VM) es un ordenador simulado que se puede ejecutar en un equipo real. Por ejemplo, puede ejecutar un programa en su ordenador portátil que " juega " una máquina virtual, lo que abre una ventana que parece que se está ejecutando otro equipo. En efecto, un equipo de simulación se ejecuta dentro del ordenador real.

Se le descargando una máquina virtual, y mientras se ejecuta, te instala Hadoop.

Apache Bigtop es una gran alternativa si quieres montar sus propios componentes de Hadoop. Bigtop reúne los componentes básicos de Hadoop para usted y asegura que su configuración funciona. Apache Bigtop es una distribución de código abierto 100 por ciento.

El objetivo principal de Bigtop - sí un proyecto de Apache, como Hadoop - es construir una comunidad alrededor de los envases, la implementación y la integración de los proyectos en el ecosistema Hadoop. La atención se centra en el sistema en su conjunto y no en proyectos individuales.

Usando Bigtop, puede instalar fácilmente y desplegar componentes Hadoop sin tener que localizarlos en una distribución específica y relacionarlos con una versión específica Hadoop. A medida que nuevas versiones de componentes de Hadoop se liberan, a veces no funcionan con las versiones más recientes de otros proyectos. Si estás por tu cuenta, es necesario realizar una prueba significativa.

Con Bigtop (o un lanzamiento comercial Hadoop) usted puede confiar en que los expertos de Hadoop han hecho esta prueba para usted. Para que te hagas una idea de cómo expansiva Bigtop ha conseguido, consulte la siguiente lista de todos los componentes incluidos en Bigtop:

  • Apache Crunch

  • Apache Flume

  • Apache Giraph

  • Apache HBase

  • Apache HCatalog

  • Apache Hive

  • Apache Mahout

  • Apache Oozie

  • Apache Pig

  • Apache Solr

  • Apache Sqoop

  • Apache Runrunear

  • Apache Zookeeper

  • Cloudera Hue

  • LinkedIn DataFu

Esta colección de proyectos ecosistema Hadoop es casi tan amplia como se pone, como se incluyen dos proyectos mayores y menores. Apache Bigtop está evolucionando continuamente.