大数据框架Hadoop(三) HDFS的HA和联邦

hdfs 2的HA机制

  • HDFS的HA,指的是在一个集群中存在两个NameNode,分别运行在独立的物理节点上。在任何时间点,只有一个NameNode是处于Active状态,另一种是standby状态。Activite NameNode负责所有客户端操作,而standby NameNode用来同步Active NameNode的状态信息来提高快速的故障恢复能力。

大数据框架Hadoop(二)HDFS

hdfs是是一个分布式的(Distributed)文件(File)系统(System)

  • 通俗的说,hdfs是一个可以管理多台机器文件的管理系统。
  • 允许文件通过网络在多台主机上分析的文件系统,可以让多机器上的多用户分享文件和存储空间。
  • 通透性。让实际上通过网络来访问文件的动作,由程序与用户看来,就像是访问本地磁盘一样。
  • 容错。若系统中有些节点宕机,整体来说系统可以持续运作而不会有数据损失(通过副本机制实现)
  • 分布式文件管理系统(hdfs,S3,GFS等)很多,hdfs只是其中一种,hdfs不适合存储小文件。
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×