Hadoop HDFS

Hadoop HDFS

HDFS 全称是 Hadoop Distributed File System,是 Hadoop 的分布式文件系统。

它由很多机器组成,每台机器上运行一个 DataNode 进程,负责管理一部分数据。

然后有一台机器上运行了 NameNode 进程,NameNode 大致可以认为是负责管理整个 HDFS 集群的这么一个进程,它里面存储了 HDFS 集群的所有元数据。