Dans une première partie, l‘objectif de cet enseignement très pratique est de présenter comment installer et configurer Hadoop, d’initier au modèle de programmation MapReduce et à l’utilisation de technologies de l'écosystème YARN tels que Spark en mode cluster, dans la perspective du projet Fil Rouge démarrant en P2.
Parmi les points abordés : aspects théoriques du calcul distribué (verrous distribués, algorithmes d'élection, paradigmes de calcul distribué, problème de consensus, tolérance à la panne, etc.), utilisation des machines virtuelles, installation du framework Hadoop (Zookeeper + HDFS + MapReduce), administration du framework Hadoop (taux de réplication HDFS), utilisation du framework Hadoop pour la mise en œuvre d'opérations MapReduce avec utilisation de la bibliothèque Hadoop streaming
- Enseignant: Leonardo Linguaglossa
- Enseignant: Bertha Helena Rodriguez
- Enseignant responsable de l'UE: Marc Jeanmougin