Le tutoriel est bien fait dans l'ensemble. La partie installation permet de se faire une idée du fonctionnement concret à l'aide d'un PoC facile à mettre en place.
Notes:
- pour le texte dont on veut compter les mots, j'ai pris un texte libre de droits disponible ici.
- pour l'archive de hadoop, le lien fourni par défaut par le site d'apache ne fonctionnait pas. A la place, j'ai pris celui du CIRIL.