博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hadoop之 Hadoop 2.x HA 、Federation
阅读量:6719 次
发布时间:2019-06-25

本文共 987 字,大约阅读时间需要 3 分钟。

HDFS2.0之HA

主备NameNode:

  1、主NameNode对外提供服务,备NameNode同步主NameNode元数据,以待切换;
  2、主NameNode的信息发生变化后,会将信息写到共享数据存储系统中让备NameNode合并到自己的内存中;
  3、所有DataNode同时向两个NameNode发送心跳信息(块信息);

两种切换方式:

  1、手动切换:通过命令实现主备之间的切换,可以用于HDFS升级等场合;
  2、自动切换:基于Zookeeper实现;
    Zookeeper Failover Controller:向Zookeeper注册NameNode并监控NameNode健康状态,当NM挂掉后,ZKFC为NameNode竞争锁,获得锁的NameNode变成active;

多种共享数据存储系统可供选择

  1、NFS
  2、多个Journal Node构成集群(推荐)
    基本原理,数据同时写入所有的JN,多数写入成功,则认为写成功;
    一般配置奇数个JN,JN越多,容错性越好;比如有3个JN,只要两个写成功,则数据写成功,最多允许一个JN挂掉;
  3、Bookeeper

相对于hadoop1.x中多了备NameNodeJournalNode(存储共享数据)ZKFC&ZK(主备NN切换)

 

HDFS2.0之Federation

多个NN同时对外提供服务,每个NN分管一部分目录,多个NN共享底层DN存储;

此时每个NN都还是存在单点故障问题的,故还需要给Federation节点配置一个备用NN;
所有整个HADOOP2集群中可能存在的NN有:多个NN以及每个NN对应的备NN

带来的好处:单个NN内存和并发压力减小,NN彼此隔离,互不影响

常见应用方法:

  为不同业务创建不同NN,防止相互影响;(一个NN给开发用,一个NN测试用)
  为不同需求创建不同NN,比如测试用的NN,生产用的NN;

 

HDFS2.0之其他实现机制(与1.0版本基本一致)

1、文件放置策略

  文件被切成若干个block,存放在不同节点上;
  切分过程对用户透明;

2、文件容错策略

  基于副本的容错机制;
  流水线复制;

3、副本放置策略

  一个节点(1个rack)+ 两个节点(另1个rack)

4、......

转载地址:http://zxcmo.baihongyu.com/

你可能感兴趣的文章
零基础如何学习Python编程
查看>>
gallery长按监听
查看>>
创建swap分区脚本
查看>>
CI框架获取post和get参数 CodeIgniter
查看>>
VRRP虚拟冗余路由协议配置实验:
查看>>
Hanlp在ubuntu中的使用方法介绍
查看>>
阿里分布式事务框架GTS开源啦!
查看>>
论router-on-a-stick和VLAN-IF
查看>>
网络分流器-网络分流器-5G的关键技术第一篇
查看>>
区块链之Hyperledger(超级账本)Fabric v1.0 的环境搭建(超详细教程)
查看>>
大快搜索数据爬虫技术实例安装教学篇
查看>>
Navicat使用教程:从MySQL中的多个表和视图中获取行计数(第3部分)
查看>>
进程和计划任务
查看>>
python机器学习实战(一)
查看>>
rm删除破折号开头的文件或目录
查看>>
找工作的程序员必懂的Linux
查看>>
滴滴发布2018年度总结:又有网友炸锅了
查看>>
PCB画板软件那么多,我到底该学习哪一个?
查看>>
linux创建用户与用户组
查看>>
如何从Spotify Music中删除DRM?
查看>>