Connaitre l'état de son stockage HDFS

Dans la famille des options pratiques, je voudrais dfsadmin –report ou comment obtenir une photo de son système HDFS. Une commande bien pratique pour connaitre rapidement la quantité de disque disponible, le nombre de  DataNodes en cours d'exécution, des blocs corrompus…
hdfs dfsadmin –report
Ce qui donne : hdfs dfsadmin –report   Quelques précisions sur ce résultat : Configured Capacity : c'est, en toute logique, la capacité totale disponible pour HDFS pour le stockage. DFS Used correspond à l'espace de stockage qui a été utilisé par HDFS. Afin d'obtenir la taille réelle des fichiers stockés dans HDFS, divisez le 'DFS Used' par le facteur de réplication. Le facteur de réplication se trouve dans le fichier de configuration hdfs-site.xml configuré sous le paramètre dfs.replication.  Donc, si le DFS utilisé est de 90 Go et votre facteur de réplication est de 3, la taille réelle de vos fichiers dans HDFS sera 90/3 = 30 Go.    

Nicolas Housset

Passionné d'informatique, je suis Consultant et expert technique SAS VIYA, également co-fondateur de la société Flexcelite. Spécialisé dans les technologies SAS (Viya, 9.4) et les infrastructures associées (Linux, Hadoop, Azure), ce blog est mon espace pour partager mes mémos techniques et retours d'expérience.