基础设施|云计算灾难恢复最佳实践

基础设施|云计算灾难恢复最佳实践
文章插图

转载自 云计算D1net原创 Collins Ayuya

考虑到当今商业环境中采用的云计算技术迅速增加,从导致服务中断和停机的灾难中有效恢复的能力变得更加重要。基于云计算的灾难恢复可以确保企业在尽可能短的时间内恢复其数据和服务的正常运行。

什么是云计算灾难恢复?
灾难恢复是指企业为灾难做好准备以及从灾难中恢复的过程。作为企业业务连续性计划的一个组成部分,灾难恢复旨在保护企业的资产。因此,云计算灾难恢复计划是一组程序和措施,以确保企业的业务顺利运行,由云计算提供商提供的专用设施提供支持。

云计算灾难的发生
了解如何为云计算灾难做好准备以及了解这些灾难如何发生非常重要。首先,业务资产可能会以技术故障的形式暴露在云计算灾难中,例如,当电源或网络连接中断时。
其次,在托管企业正在使用的云服务的服务器所在的地区可能会发生风暴、洪水或地震等自然灾害,从而导致服务中断和停机。
云计算灾难可能以人为灾难的形式发生,这比自然灾害更常见,并且可能涉及导致严重服务中断的简单错误。它们经常在使用云服务时发生,不幸的是无法根除。例如,它们可能是由输入错误、简单的配置错误、意外删除或未能执行软件更新而触发——这使得威胁行为者很容易控制云服务。
当威胁行为者通过勒索软件等恶意软件访问云服务时,他们就会对企业的基础设施构成威胁。这些威胁行为者很容易导致服务中断,并为了自己的利益而中断受害者的业务运营。勒索软件是当今云计算数据的一大挑战,这些威胁不断发展的事实使它们变得更加令人生畏。

为云计算灾难做好准备
要为云计算灾难做好准备,企业需要不断测试其数据恢复框架。企业可以进行一些测试:

  • 完全中断测试。作为可以执行的最彻底的测试,完全中断测试将会停止运营并复制灾难,以衡量企业如何应对实际灾难。它可能代价高昂,并且在不成功的情况下可能会无意中造成重大中断。
  • 演练测试。与完全中断测试相比,这种测试不那么彻底,企业需要审查灾难恢复计划,并提供机会找出差距以改进灾难恢复计划。
  • 并行测试。恢复操作在与主要系统不同的网络上执行。
  • 模拟测试。模拟灾难以提示团队模拟他们记录的灾难恢复计划。这可以随机进行,以衡量响应者的准备情况和现有策略的有效性。

云计算灾难恢复的重要性
云计算灾难恢复减少了对物理基础设施的依赖。这简化了企业的运营,因为企业将其灾难恢复工作负载外包。此外,企业无需升级或支持其物理基础设施以在远程站点进行灾难恢复。基于云计算的服务提供了额外的优势,例如自动化,这是减少人为错误的一种方法。
与内部部署的灾难恢复相比,云计算灾难恢复更加简单。通过云计算方法可以简化与管理自己的灾难恢复过程相关的复杂性。例如,测试数据恢复框架不仅更容易,而且更可行。
此外,企业在选择恢复方法时享有很大的灵活性,可以经济高效地组合各种恢复方法,而不会影响他们所需的服务。云计算灾难恢复选项提供高可扩展性,因为服务器和基础设施可以基于现收现付等模型进行扩展。

云计算灾难恢复的最佳实践
(1)选择合适的灾难恢复计划方法
要制定合适的灾难恢复计划,企业了解其IT基础设施非常重要。通过这种方式,可以选择正确的灾难恢复计划方法。可以使用备份和恢复方法,这需要使用托管备份解决方案在其方便时处理数据的备份和恢复。