Le tutoriel est bien fait dans l'ensemble. La partie installation permet de se faire une idée du fonctionnement concret à l'aide d'un PoC facile à mettre en place.
Notes:
pour le texte dont on veut compter les mots, j'ai pris un texte libre de droits disponible ici.
pour l'archive de hadoop, le lien fourni par défaut par le site d'apache ne fonctionnait pas. A la place, j'ai pris celui du CIRIL.