25年在马来西亚某大型IDC机房建设项目,客户要求采购的网络运维监控软件,必须实现双机热备,30秒能完成切换。
因为用户没有单独的操作系统及商业化热备软件预算,厂家交付工程师和集成商项目组论证后,在两台Dell Poweredge R450服务器上,采用较为成熟的开源CentOS+Keepalived方案。相对于常见的如ERP,OA等业务系统,运维管理系统的双机热备设计更为复杂,除了底层Mysql数据库同步,操作系统虚拟IP的接管,还有数据采集引擎的快速启动和初始化,切换过程无告警误报的要求。
项目组在国内搭建环境多次测试,系统调优,确定在主服务器关机、重启或网络掉线20秒内,备机完成系统级切换,用户可登录Portal。60秒内全部数据刷新。切换过程中无误报。
25年春节前,和工程师远赴几千公里的现场,2天内完成交付,测试通过,一切顺利!OLG
现场机房远景