Apache Hadoop: Introducción a YARN

yarn architecture

En este artículo se va a realizar una introducción a YARN, el cual es básicamente una versión mejorada de la arquitectura MapReduce. Es por esto que también se le suele denominar MapReduce 2.0 (MRv2) y está disponible desde la distribución Seguir leyendo Apache Hadoop: Introducción a YARN

Apache Hadoop: Ejecutar MapReduce en HDFS

hadoop

En este tutorial se va a ver como ejecutar MapReduce en HDFS. Para comprender completamente este tutorial es necesario que le echéis un vistazo a los artículos y tutoriales anteriores dependiendo del nivel que tengáis en la materia: Introducción a Apache Seguir leyendo Apache Hadoop: Ejecutar MapReduce en HDFS

Apache Hadoop: Introducción a HDFS

Apache HDFS

En este artículo vamos a ver una breve introducción a HDFS (Hadoop Distributed File System) antes de continuar con su uso práctico (ejecutaremos el programa creado en el turorial sobre MapReduce sobre este filesystem). HDFS es un sistema de ficheros Seguir leyendo Apache Hadoop: Introducción a HDFS