Hadoop(2.x)云计算生态系统

分布式存储系统HDFS

  • 分布式存储系统
  • 提供了高可靠性、高扩展性和高吞吐率的数据存储服务

基本原理

将文件切分成等大的数据块,存储到多台机器上

将数据切分、容错、负载均衡等功能透明化

可将HDFS看成一个容量巨大、具有高容错性的磁盘

应用场景

海量数据的可靠性存储

数据归档

文件系统架构

HDFS文件系统架构

NameNode节点通过NFS与Zookeeper实现高可用