O que é Disaster Recovery e porque um gestor de TI precisa se preocupar com isso?

o-que-e-disaster-recovery

Pequenos “desastres” como o roubo de um notebook ou a perda de um HD já deixaram muitas pessoas “de cabelo em pé”. Fazendo a comparação com o mundo corporativo, onde a tecnologia da informação é fundamental para as empresas e seus negócios, a perda de informações ou a incapacidade de operar por indisponibilidade da infraestrutura de TI é um desastre elevado à potência máxima. Apesar da conotação trágica, incidentes podem acontecer, e para trazer segurança às operações, as áreas de TI precisam tratar de políticas de disaster recovery (DR) ou recuperação de desastres.

Você, gestor de TI, pode estar pensando que, na sua região, os fenômenos naturais, como terremotos, tsunamis e furacões são raros. Logo não precisa se precaver quanto à continuidade dos serviços de TI, pois seus dados e sua infraestrutura estão em segurança. No entanto, a fatalidade do 11 de Setembro em Nova Iorque, que impactou o mundo todo em diversos aspectos, mostrou que as empresas precisam se preocupar até com o improvável e contar com planos efetivos de disaster recovery. Se pensarmos em termos de Brasil, no ano de 2015, o país enfrentou problemas com o abastecimento de energia elétrica. Uma situação atípica e prolongada como esta poderia colocar em risco seus serviços de TI.

Para estar preparado para estas contingências conheça mais sobre DR:

# O que é disaster recovery?

Ações ou planos para recuperação de desastres definem procedimentos que deverão ser aplicados sempre que ameaças como incêndios, inundações, vandalismo, sabotagem, furacões, vendavais ou outros incidentes comprometerem as operações de TI. O disaster recovery visa restabelecer os serviços, ao menor custo e com os menores impactos possíveis, em um espaço de tempo aceitável para o negócio da empresa.

Para estabelecer uma estratégia de recuperação de desastres, você precisa avaliar as necessidades envolvidas na continuidade dos negócios da sua organização, considerando principalmente métricas de:

Objetivo de tempo de recuperação (RTO): que determinam o tempo ideal, após a interrupção dos serviços, para a restauração do processo de negócio. Para empresas do varejo, por exemplo, se ocorrer um desastre que derrube seu e-commerce (comércio eletrônico), o tempo para retorno do mesmo é extremamente relevante. Logo, é importante dar força ao RTO e determinar quanto tempo depois da interrupção o serviço deve estar disponível novamente.

Objetivo de ponto de recuperação (RPO): aqui é determinada a quantidade aceitável de perda de dados medidas em tempo, até a ocorrência do desastre e interrupção  dos serviços. Indica o ponto de restauração ou idade dos arquivos necessários para restabelecimento das operações normais. Para uma empresa do setor financeiro, por exemplo, esse objetivo tende a ser zero.

Além da perda direta de dados, a inatividade da infraestrutura também pode causar impactos fortíssimos na operação de uma empresa. Uma companhia financeira por exemplo, que oferece como serviço a venda por cartões, tem como custo médio por hora de interrupção do serviço, o valor de US$ 3.1 milhões.

# Principais estratégias para disaster recovery

Com a digitalização dos negócios, a preocupação com a continuidade dos serviços de TI é crescente, e a nuvem tem se tornado uma grande aliada nesses planos. Por ter um custo acessível, elasticidade instantânea e múltiplas localizações, ela oferece as condições e a segurança tão almejada pelos gestores de TI. A nuvem oferece alternativas para cada modelo de negócio e necessidade de resposta aos objetivos de tempo e ponto de recuperação.

Após avaliar seu modelo de negócios e estabelecer os objetivos de disaster recovery mais relevantes para a segurança da sua operação, você precisa entender quais as estratégias de recuperação de desastres disponíveis. Dessa forma, você conseguirá identificar qual a melhor para sua empresa.

A Amazon Web Services, segundo o Quadrante Mágico do Gartner para IaaS na Nuvem (Magic Quadrant for Cloud Infrastructure as a Service, Worldwide), aparece como o principal player para serviços de infraestrutura na nuvem. A AWS oferece estratégias para disaster recovery sob medida para cada tipo de negócio. Confira:

  • Disaster Recovery Backup Off-site

Neste modelo os dados da empresa são armazenados como backup na nuvem. Em caso de falhas no ambiente de produção, estes dados são utilizados na criação de novos servidores – normalmente por meio de imagens dos servidores. Este modelo possui o melhor custo, referente apenas ao backup, mas exige o maior tempo para recuperação.

  • Disaster Recovery Pilot Light

Nessa estratégia mantém-se um servidor ativo como réplica do banco de dados e os demais servidores ficam desligados. Em caso de falhas no datacenter principal, os servidores são ligados e o servidor de banco de dados é aumentado para suportar o tráfego da aplicação.

  • Disaster Recovery Warm StandBy

Aqui a estrutura de disaster é replicada para a nuvem e os servidores ficam ligados o tempo todo, mas com tamanho reduzido ao mínimo para operar em standby. Em caso de falha do datacenter principal, a estrutura é escalada e os servidores da nuvem aumentados para suportar a demanda da aplicação.

  • Disaster Recovery Multi-site

Nesta estratégia o datacenter convencional é replicado integralmente para a nuvem, com todos os servidores ligados e recebendo o tráfego da aplicação. Assim, os dois ambientes operam em produção e, em caso de falha de um deles, o outro assume o tráfego e é capaz de suportar toda a carga da aplicação. Esse é o modelo de maior custo, mas tem o melhor tempo de recuperação, tendendo a zero.

  • Agent Replication

São utilizadas ferramentas de replicação de dados em nível de blocos que, instaladas nos servidores locais, replicam os dados para a nuvem praticamente em tempo real. A ferramenta orquestra também o processo de teste do ambiente de disaster recovery, facilitando o processo. Essa estratégia é indicada para uma replicação transparente do ambiente, pois propicia comodidade no processo de DR, sem precisar ter os servidores rodando na nuvem sem necessidade.
Quando se trata da segurança da infraestrutura e dos serviços de TI da sua empresa não dá pra contar com a sorte.

Avalie a melhor estratégia de recuperação de desastres para sua empresa e busque uma parceria de sucesso com a BRLink, especialista em nuvem e parceiro certificado da Amazon Web Services.

whitepaper business intelligence