Apache Hadoop: Reducir el consumo de ancho de banda usando Combiner

En anteriores publicaciones del tutorial de Apache Hadoop que se está realizando, así como en la gran mayoría artículos que se pueden encontrar navegando por la red, se menciona la gran cantidad de ventajas y bondades que presenta esta tecnología, Seguir leyendo Apache Hadoop: Reducir el consumo de ancho de banda usando Combiner

Apache Hadoop: Crear aplicaciones YARN. Cliente y Master básicos

hadoop

En este tutorial se va continuar aprendiendo cómo crear aplicaciones YARN. En el artículo anterior, crear aplicaciones YARN 1/3, se hizo una explicación del funcionamiento general, de modo teórico, de YARN así como de los elementos que intervienen en su Seguir leyendo Apache Hadoop: Crear aplicaciones YARN. Cliente y Master básicos

Apache Hadoop: Crear aplicaciones YARN. Comunicaciones

hadoop

En este artículo se va a mostrar, a un alto nivel, cómo crear aplicaciones YARN de Hadoop. Como comentaba en el artículo de introducción a YARN se trata de una nueva implementación mejorada de la arquitectura MapReduce disponible desde la Seguir leyendo Apache Hadoop: Crear aplicaciones YARN. Comunicaciones

Apache Hadoop: Introducción a YARN

yarn architecture

En este artículo se va a realizar una introducción a YARN, el cual es básicamente una versión mejorada de la arquitectura MapReduce. Es por esto que también se le suele denominar MapReduce 2.0 (MRv2) y está disponible desde la distribución Seguir leyendo Apache Hadoop: Introducción a YARN

Apache Hadoop: Diferencia entre hadoop fs y hdfs dfs

hadoop

En este artículo vamos a explicar la diferencia entre hadoop fs y hdfs dfs. El ambiguo uso que se hace de estos dos comandos en distintos tutoriales y ejemplos que se pueden encontrar en la red pueden llevar a confusión Seguir leyendo Apache Hadoop: Diferencia entre hadoop fs y hdfs dfs

Apache Hadoop: Ejecutar MapReduce en HDFS

hadoop

En este tutorial se va a ver como ejecutar MapReduce en HDFS. Para comprender completamente este tutorial es necesario que le echéis un vistazo a los artículos y tutoriales anteriores dependiendo del nivel que tengáis en la materia: Introducción a Apache Seguir leyendo Apache Hadoop: Ejecutar MapReduce en HDFS

Apache Hadoop: Introducción a Hadoop en Azure

Apache Hadoop logo

En la conferencia de ØREDEV en Suecia, Yaniv Rodenski realizó una Introducción a Hadoop en Azure, discutiendo cómo funciona, diversas opciones de almacenamiento, integración de servicios en la nube y muchas más cosas. Si no conocéis Azure, os diré que Seguir leyendo Apache Hadoop: Introducción a Hadoop en Azure

Apache Hadoop: Introducción a HDFS

Apache HDFS

En este artículo vamos a ver una breve introducción a HDFS (Hadoop Distributed File System) antes de continuar con su uso práctico (ejecutaremos el programa creado en el turorial sobre MapReduce sobre este filesystem). HDFS es un sistema de ficheros Seguir leyendo Apache Hadoop: Introducción a HDFS

Apache Hadoop: Instalación y tutorial de MapReduce

Apache Hadoop logo

Después de hacer una breve  introducción a Apache Hadoop vamos a mostrar cómo se instala en un sistema operativo GNU/Linux Ubuntu 12.10 para después poder ejecutar y crear un tutorial de MapReduce que vamos a desarrollar. Para comenzar, descargamos la Seguir leyendo Apache Hadoop: Instalación y tutorial de MapReduce

Apache Hadoop: Programando con Hadoop (EN)

Apache Hadoop logo

Aquí os enlazo un vídeo, en inglés y de la mano de cloudera, de introducción a la programación con Hadoop dónde se muestra su API, algunos ejemplos y sobre todo se explican con detalle los conceptos que forman parte o Seguir leyendo Apache Hadoop: Programando con Hadoop (EN)