Apache Hadoop: Reducir el consumo de ancho de banda usando Combiner

En anteriores publicaciones del tutorial de Apache Hadoop que se está realizando, así como en la gran mayoría artículos que se pueden encontrar navegando por la red, se menciona la gran cantidad de ventajas y bondades que presenta esta tecnología, Seguir leyendo Apache Hadoop: Reducir el consumo de ancho de banda usando Combiner

Apache Hadoop: Crear aplicaciones YARN. Cliente y Master básicos

hadoop

En este tutorial se va continuar aprendiendo cómo crear aplicaciones YARN. En el artículo anterior, crear aplicaciones YARN 1/3, se hizo una explicación del funcionamiento general, de modo teórico, de YARN así como de los elementos que intervienen en su Seguir leyendo Apache Hadoop: Crear aplicaciones YARN. Cliente y Master básicos

Apache Hadoop: Crear aplicaciones YARN. Comunicaciones

hadoop

En este artículo se va a mostrar, a un alto nivel, cómo crear aplicaciones YARN de Hadoop. Como comentaba en el artículo de introducción a YARN se trata de una nueva implementación mejorada de la arquitectura MapReduce disponible desde la Seguir leyendo Apache Hadoop: Crear aplicaciones YARN. Comunicaciones

Apache Hadoop: Introducción a YARN

yarn architecture

En este artículo se va a realizar una introducción a YARN, el cual es básicamente una versión mejorada de la arquitectura MapReduce. Es por esto que también se le suele denominar MapReduce 2.0 (MRv2) y está disponible desde la distribución Seguir leyendo Apache Hadoop: Introducción a YARN

Apache Hadoop: Ejecutar MapReduce en HDFS

hadoop

En este tutorial se va a ver como ejecutar MapReduce en HDFS. Para comprender completamente este tutorial es necesario que le echéis un vistazo a los artículos y tutoriales anteriores dependiendo del nivel que tengáis en la materia: Introducción a Apache Seguir leyendo Apache Hadoop: Ejecutar MapReduce en HDFS

Introducción a MongoDB

Tutorial de MongoDB con Java

En este artículo se va a realizar una breve introducción a MongoDB, un sistema gestor de bases de datos NoSQL, completamente open source (código abierto) orientado principalmente a documentos. Para los que os suene a nuevo el concepto de NoSQL, Seguir leyendo Introducción a MongoDB

Apache Hadoop: Instalación y tutorial de MapReduce

Apache Hadoop logo

Después de hacer una breve  introducción a Apache Hadoop vamos a mostrar cómo se instala en un sistema operativo GNU/Linux Ubuntu 12.10 para después poder ejecutar y crear un tutorial de MapReduce que vamos a desarrollar. Para comenzar, descargamos la Seguir leyendo Apache Hadoop: Instalación y tutorial de MapReduce

Apache Hadoop: Aplicaciones distribuidas con petabytes de datos

Apache Hadoop logo

Seguramente a la mayoría no os suene en nombre de Apache Hadoop, a pesar de que cada vez está adquiriendo más popularidad aún es un gran desconocido. Apache Hadoop es un framework desarrollado en Java y de licencia libre que Seguir leyendo Apache Hadoop: Aplicaciones distribuidas con petabytes de datos