有做过运维或熟悉HA的同学在吗?请教几个关于HA双机热备的问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
Keyes
V2EX    Python

有做过运维或熟悉HA的同学在吗?请教几个关于HA双机热备的问题

  •  
  •   Keyes 2013-11-14 10:42:52 +08:00 9729 次点击
    这是一个创建于 4381 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我们现在的项目需要实现HA双机热备功能,因为我基本上没碰过这些东西,现在实现上是有解决方案(HB+DRBD+GFS2),心跳、数据同步、虚拟IP迁移和我们业务应用的关联都已经做好。但是因为不清楚HA在环境中的具体工作规则,使用方法上一直定不下来,整理了几个使用上的问题向各位请教:

    1、配置双机热备时,是先配置主机还是先配置备机?(或先激活主机还是先激活备机?)
    2、双机的各种HA相关参数,是在主机上配置好同步到备机,还是两边都要手动填一样的参数才能激活HA?
    3、双机都正常,拔掉HA线会产生什么后果?(如两台机器会相互争夺虚拟IP吗?)
    4、双机都正常,备机可以使用吗?(使用包括:提供完整的业务服务)
    5、备机上有提供强制从HA组中脱离的功能吗?
    6、主机宕机,备机工作,然后宕机的主机拿回去返厂,厂商换了个新的设备回来,要怎样操作才能重新挂载回HA组中?

    大概就是这些疑惑,虽然已经想到部分问题的解决方法,但是依然不能确定(防止出个奇葩操作方法搞得客户郁闷),如果各位有相关的经验,真心浪费几分钟指点楼主一番,先谢过了:)
    9 条回复    1970-01-01 08:00:00 +08:00
    lixm
        1
    lixm  
       2013-11-14 10:58:35 +08:00   1
    1、一般情况下,主备机的配置不分先后,除非你在生产环境直接配置,也不打算测试
    2、开源软件实现的话,一般是没有同步功能的,而且主备机的配置会有微小的区别
    3、心跳线断开会造成脑裂,也就是主备机都争抢VIP,这个是非常严重的后果
    4、要看具体的业务场景,部分业务场景开源做到双A,例如负载均衡器
    5、不太清楚你所说的脱离是指什么
    6、恢复原主机的配置就可以了
    Keyes
        2
    Keyes  
    OP
       2013-11-14 11:08:02 +08:00
    @lixm 非常感谢,追问一下哈
    1、就是说两边随意顺序配置,配好把线连上?还是说先连好HA线,再随意顺序配置两台机器?
    2、这个功能是我自己实现哈,所有HA相关的东西我都写了一个HA服务管理器来管住他们
    3、明白了
    4、比如说防火墙是什么样的?
    5、就是直接把备机拿走了,备机的话直接拔线再上去关HA功能就行了吧?
    6、你碰到的设备没有自动恢复配置和数据的功能吗?

    再追问一个:
    追1:设备的牌子能说下么……
    halfbloodrock
        3
    halfbloodrock  
       2013-11-14 12:05:57 +08:00   2
    1、配置双机热备时,是先配置主机还是先配置备机?(或先激活主机还是先激活备机?)

    双机HA的配置是完全一样的。所有的HA软件都是这样,所以没有先后。


    2、双机的各种HA相关参数,是在主机上配置好同步到备机,还是两边都要手动填一样的参数才能激活HA?

    看第一个



    3、双机都正常,拔掉HA线会产生什么后果?(如两台机器会相互争夺虚拟IP吗?)

    双机HA是需要一个fence设备保证不出现脑裂问题,也就是主备互抢。不管什么情况,心跳断掉之后,active节点会被fence设备强制下线,备机成为active。

    但是注意!不同的HA软件对“双节点HA”处理方式有区别。Redhat的HA必须要启用仲裁磁盘,因为他默认的仲裁机制有点不够合理。。。而VCS则不一定需要仲裁磁盘。


    4、双机都正常,备机可以使用吗?(使用包括:提供完整的业务服务)

    对于同一个应用,备机可用叫做Load balance。

    但是可以在备机上提供其他应用。

    我的工作中,经常会在一个4节点上的HA集群组里每个节点跑一个oracle,每个节点实例不一样,提高节点的利用率。



    5、备机上有提供强制从HA组中脱离的功能吗?

    不明白意思。

    一般来说,如果需要某个节点脱离HA,VCS里可以做freeze操作,所有节点就脱离了集群,但是应用本身依然正常,此时不会产生任何的热迁移操作。

    Redhat HA里有没有我忘记了。。。。。


    6、主机宕机,备机工作,然后宕机的主机拿回去返厂,厂商换了个新的设备回来,要怎样操作才能重新挂载回HA组中?

    安装HA软件,同步配置文件,配置好共享存储。一两句说不清,但是大致如此。
    princeofwales
        4
    princeofwales  
       2013-11-14 12:12:52 +08:00   1
    个人看法:
    1、主备是相对的,任意一台当主都可以。一般习惯上认为第一台是主的,这只是主观意识
    2、HA参数,是在HA软件里配置的,配置之前需要先连接主备机,两机共用一个参数配置,只需要填一次
    3、拔HA线,你指的是心跳线?心跳断了,该是仲裁盘出场了,谁先抢到谁做主。双节点的Oracle RAC是个例外,根据master node判断
    4、单纯的HA,热备机是不能支持业务的。至于主备双活,我们一般不称为HA,比如ORACLE ADG
    5、备机可以支持关机的,热备就成为冷备了。若需要脱离,需要从HA软件里配置,删除备机节点即可
    6、这种场景相当于将一台新机加入HA,对于不能停机的业务比较麻烦。本人建议,新机首先不要接公共存储,但路径要存在,比如用本地盘暂时代替,再按原路径装好软件,用存储代替那个临时的本地盘,然后再配置HA软件。高风险操作,注意配置新机的环境时,不要把存储上的数据覆盖掉了,不然……
    Keyes
        5
    Keyes  
    OP
       2013-11-14 13:44:49 +08:00
    @halfbloodrock
    @princeofwales

    感谢耐心解释,楼上几位对我理解HA起到了很大的作用,让我确认了不少东西(包括之前摸黑战争自己瞎猜的一些错误想法)

    我这边设备是没有用这些集群管理套件的,比如REDHAT那个和VCS,我只是用HB+DRBD做一个HA基本底层出来,然后在我应用层去管理这两个东西
    halfbloodrock
        6
    halfbloodrock  
       2013-11-14 14:20:09 +08:00   1
    @Keyes 只用heartbeat的话,注意下fence功能,好像heartbeat不包含fence功能。。。可能需要你自己实现了。
    laneovcc
        7
    laneovcc  
       2013-11-16 20:58:52 +08:00   1
    请研究http://www.linux-ha.org/wiki/Pacemaker
    官网 http://clusterlabs.org/

    双机一般都不能“热备”, 双机是给人工切换用的。 请使用3+以上机器

    1、配置双机热备时,是先配置主机还是先配置备机?(或先激活主机还是先激活备机?)
    其实不存在,只有哪台决策的问题, 这个默认会协调的

    2、双机的各种HA相关参数,是在主机上配置好同步到备机,还是两边都要手动填一样的参数才能激活HA?
    正常一点的HA软件都只会让你用一套配置

    3、双机都正常,拔掉HA线会产生什么后果?(如两台机器会相互争夺虚拟IP吗?)
    要看HA软件, 一般要设置一下,Pacemaker默认是当前Cluster的机器小于等于总机器的50%,该Cluster都不会提供服务

    4、双机都正常,备机可以使用吗?(使用包括:提供完整的业务服务)
    看你业务

    5、备机上有提供强制从HA组中脱离的功能吗?
    参加第3条

    6、主机宕机,备机工作,然后宕机的主机拿回去返厂,厂商换了个新的设备回来,要怎样操作才能重新挂载回HA组中?
    添加进Cluster就是了
    panzhc
        8
    panzhc  
       2013-11-17 10:18:01 +08:00
    HB+DRD+GFS2,楼主真的都试过这三样软件吗?
    chengxuan
        9
    chengxuan  
       2014-02-09 02:49:09 +08:00
    学习啦。。。好贴子!!
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1007 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 18:51 PVG 02:51 LAX 10:51 JFK 13:51
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86