常见问题 / 关于数腾

在应对诸如删库跑路事件,从灾备角度,可以做哪些事情?

2020-04-02

加强事前、事中、事后各个方面的防范与补救。

第一,加强运维管理。生产工具的自动化报警与监控,操作员的权限管理(比如采用分权管理、双应答机制等),关键操作不可提供远程,修改核心程序需要提交工作流程和审核,且重要操作要求至少两人在场等,避免人为主观破坏。

第二,完善备份制度。设定合理的备份策略,如每天一次增量,每周一次全备,一个月一次完整备份等,多种备份策略同时进行,设定灾备专员,定期演练及备份离线出库等。

第三,本地采用高可用集群方式,且对数据采用实时备份。对核心业务采用事先搭建应急系统,或通过镜像等其他手段实现快速恢复,保障数据安全及业务的连续性。

第四,同城容灾,在同城80公里之外找一个容灾中心,数据实时或异步传输到同城容灾中心,可采用分布集群,数据镜像,CDP,CDR等方式。当主中心发生故障时可及时手动或自动接管业务,同步具备数据回退,容灾演练,法规遵从,业务查询等功能。

第五,异地灾备,在远离生产中心的机房,最好相距200公里以上,可以是自建,也可以租用IDC,电信,移动等有高等级运维能力的服务商托管或租用相应的备件。硬件上可以按照生产设备的比例缩减,4:1左右,主要是把生产数据定时的备份到异地,数据间隔最好在一天以内。

第六,对数据恢复预案进行梳理,考虑可能潜在的灾难事件,对灾难事件进行细化,并设计业务恢复预案,根据预案需求选择相对应的解决方案来进行应对。


可以采用数腾的云灾备解决方案,做到云上云下的业务级/数据级容灾与备份,不同云厂商之间的的业务级/数据级容灾与备份,并采用多租户管理方式进行不同灾备服务的权限管理。对于删库跑路事件,无论数据破坏多么严重,能在数分钟内恢复业务生产,甚至站点灾难事件,也能在几小时内恢复核心业务的运行。


咨询热线

400-821-6995
服务时间

周一至周五 9:30~17:30