GCNBRASIL.

Gestão de Crises e Continuidade dos Negócios

  • Increase font size
  • Default font size
  • Decrease font size

Validando os Planos de Contingência: a checagem com a realidade

Email Print

A frase "checagem com a realidade" não é mera força de expressão. De que adianta o gestor de continuidade de negócios trabalhar arduamente no mapeamento dos processos, na identificação dos SPOFs (Single Point of Failure), no gap analysis entre o que o ambiente de contingência suporta e o que o Negócio precisa, avaliar os RTOs e RPOs, avaliar Off-site e infraestrutura tecnológica, se isso não for colocado à prova com testes de contingência?

Testar os planos de contingência é sim validar e checar seu conteúdo frente a uma possível realidade a ser encarada. Esta realidade, se possível, deve ser considerada em seu pior cenário: a queda completa da sua operação física.

A execução de testes é fundamental para que usuários validem seus planos, equipes técnicas criem sinergia, que os objetivos de recuperação sejam avaliados e indiquem quais são as ações de correções para que estes objetivos sejam alcançados no prazo demandado pelo negócio, e, serve ainda, para que os planos outrora somente descritos em papel tornem-se realidade e que toda a resiliência da empresa seja testada nesta manobra.

Uma vez bem planejado, executar um teste de validação de recuperação de desastres, por exemplo, com vários componentes envolvidos é algo fundamental. Neste ponto, podemos visualizar a primeira interseção da disciplina de continuidade de negócios com as melhores práticas de governança de TIC. Se a TIC da sua empresa já possui estruturas baseadas na governança do ITIL, por exemplo, fica mais fácil conseguir executar um teste sem maiores impactos no ambiente de produção.

Planejar esse tipo de manobra fica mais fácil quando existem gerências de planejamento e mudança. Muitos acadêmicos acreditam que os gestores de continuidade de negócios gostam de fazer testes, de ficar mexendo em ambiente produtivo, de "virar" ou migrar a produção para a contingência, mas sabemos que isso não é uma manobra trivial e que manobrar ambiente produtivo, por mais que você possua uma infraestrutura redundante, envolve riscos. Por isso, quanto mais próximo sua TIC for das melhores práticas de governança de TI, menos riscos você corre nessa manobra e mais fácil será de levar isso para a sua gerência sênior.

Fazer uma manobra de simulação de queda do ambiente tecnológico e recuperação no ambiente de contingência é metade do seu planejamento para validar seus planos. A outra metade é o crucial envolvimento das áreas de negócios da empresa. É preciso considerar que testes onde somente o datacenter é testado, não é teste de continuidade de negócios, e sim, teste de TI meramente. Os usuários das áreas de negócios precisam participar da manobra, precisam estar comprometidos com o teste dos planos de contingência. Dar o sign-off de que o ambiente de contingência funciona e coletar as devidas evidências de que a manobra foi considerada bem-sucedida é algo de extrema importância para todos e, principalmente para eles que são os mais interessados em saber se de fato o plano está de acordo com o que se espera em uma situação de crise e que uma vez acionado, atende aos seus requisitos e suporta os seus processos críticos descritos em seus respectivos BIAs.

Em muitas das regulamentações que existem no mercado, a necessidade de um sign-off de que os planos foram testados e evidenciados é solicitada e por isso alguns gestores se vêem na obrigação de produzir evidências utilizando os demais tipos de testes existentes nas boas práticas da disciplina de GCN como o teste de mesa (tabletop test) ou o teste de componente e o teste de ambiente.

Não há nada de errado com esses formatos menores, mas é importante lembrar que nesses formatos não existe a garantia de que em um evento de grandes proporções, os objetivos de recuperação serão totalmente atingidos. Acho que esses tipos de testes podem ser usados como forma de preparação para um teste de maior envergadura, principalmente no que diz respeito ao envolvimento dos usuários das áreas de negócio. Com uma política bem estruturada de gestão de continuidade de negócios e com um alinhamento dos auditores, cobrando a participação das áreas, com seus times críticos nos testes e manobras de contingência é possível planejar uma validação consistente dos planos de continuidade de negócios.

Outro ponto que ressalto é a diferença entre um teste de contingência e um teste de tolerância à falha. É importante diferenciar esses conceitos: testes de contingência envolvem a participação de usuários e a medição dos objetivos de recuperação. Um dos principais pontos para mensurar é o alcance do RTO e do RPO na manobra. A medição dos objetivos de RTO e RPO é dos principais critérios que diferem a validação do plano de continuidade de negócios de um teste de tolerância à falha de um determinado ambiente ou de um determinado departamento ou andar que esta sendo testado. Portanto, se o RTO não foi alcançado, é preciso considerar o teste como falho, abrir ações de correção, determinar prazos e responsáveis para a correção e realizar outro teste em um prazo estipulado pela sua política ou pelas políticas de compliance de sua empresa.

 

PUBLICIDADE

PARCEIROS


Translate

Portuguese English French German Italian Spanish

Creative Commons License
Site GCNBRASIL - Creative Commons Atribuição-Uso Não-Comercial-Vedada a Criação de Obras Derivadas 2.5 Brasil License.