HDFS知识点思维导图
引言
前提和设计目标
硬件错误
流式数据访问
大规模数据集
简单的一致性模型
“移动计算比移动数据更划算”
异构软硬件平台间的可移植性
Namenode 和 Datanode
文件系统的名字空间 (namespace)
数据复制
副本存放: 最最开始的一步
副本选择
安全模式
文件系统元数据的持久化
通讯协议
健壮性
磁盘数据错误,心跳检测和重新复制
集群均衡
数据完整性
元数据磁盘错误
快照
数据组织
数据块
流水线复制
可访问性
DFSShell
DFSAdmin
浏览器接口
存储空间回收
文件的删除和恢复
减少副本系数
参考资料