(1) Client开始从DataNode并行读取数据
(2) Client将连接到列表中最近的DataNode
(3) Client通过DistributedFileSystem对象与集群的NameNode进行一次RPC远程调用,获取文件block位置信息
(4) 一旦Client获得了所有必须的block,它就会将这些 block 组合起来形成一个临时文件
(5) NameNode返回存储的每个块的DataNode列表
(3)(5)(2)(1)(4)
(3)(1)(2)(5)(4)
(3)(1)(5)(2)(4)
(1)(3)(5)(2)(4)