Objetivos
En esta práctica utilizaremos el sistema cloud del CESGA para crear clusters Hadoop
Pasos de la práctica (detallados en los restantes apartados de este documento)
- Instalar manualmente un cluster Hadoop v2 con máquinas virtuales el cloud
- Configurarlo y comprobar que funciona correctamente
- Añadir y retirar nodos del cluster Hadoop y hacer que el cluster sea rack-aware
Entrega
- Enviar un documento PDF donde se describan todos los pasos realizados en la práctica. El documento debería servir como guía de instalación de un cluster Hadoop para un usuario no experimentado. Debe contener capturas de pantalla con las distintas operaciones que se van haciendo en cada paso. Entre estas capturas tienen que estar, como mínimo, las siguientes:
- Capturas de pantalla en las que se vean los interfaces web del HDFS, YARN, CheckPoint Node y JobHistory Server con los nodos iniciales activos
- Capturas de pantalla del interfaz web en el que se vea un nuevo nodo añadido
- Captura de pantalla en la que se vea los nodos separados por rack (salida del comando hdfs dfsadmin -report)
Todas las imagenes en el documento tienen que ester comentadas, indicando que es lo que muestran. Enviar el documento a través del Campus Virtual de la USC. Debe ser, preferiblemente, un fichero PDF con el nombre "Hadoop-P1-vuestronombre.pdf"