À medida que uma implantação do ArcGIS Enterprise cresce em complexidade, considerações adicionais devem ser feitas quando se trata de recuperação de desastres. Essas considerações exigem uma percepção dos diferentes sistemas que formam a arquitetura de implantação. Como em muitos cenários técnicos, não há uma abordagem única para criar a cópia de segurança dos principais sistemas e dependentes em uma implantação.
O seguinte fornece uma estrutura para aumentar a taxa de sucesso da restauração durante um evento de recuperação de desastre. Essas práticas podem ser adotadas pelas organizações para definir seus procedimentos operacionais padrão como parte de um plano de Continuidade de Negócios/Recuperação de Desastres (BC/DR) em caso de desastre no contexto de sua implantação do ArcGIS Enterprise.
Práticas recomendadas para criação de cópias de segurança
Revise as práticas recomendadas a seguir para criar cópias de segurança de sua organização do ArcGIS Enterprise e quaisquer fontes de dados referenciadas.
Cópia de segurança do ArcGIS Enterprise
Uma organização do ArcGIS Enterprise é composta pelo site do Portal for ArcGIS, todos os sites federados do ArcGIS Server e seus dados associados, e os dados contidos noArcGIS Data Store. Os componentes podem ser copiados usando a ferramenta de GIS da Web - Recuperação de Desastre (WebGISDR) incluída ou usando ferramentas de terceiros para cópias de segurança com base em máquina e imagem.
A ferramenta WebGISDR é um utilitário da linha de comando incluído com Portal for ArcGIS que é usado para criar cópia de segurança de conteúdo e dados da organização, informações de site federado do ArcGIS Server e dados contidos nos armazenamentos de dados relacionais e de cache do mosaico. Essa ferramenta é particularmente útil para manter a consistência nos componentes de uma implantação de base, como também, em quaisquer sites federados adicionais, embora exija uma implantação funcional para realizar a recuperação.
O seguinte deve ser considerado fora do processo da cópia de segurança do WebGISDR:
- Sites federados do ArcGIS Mission Server ou ArcGIS Notebook Server—Se você tiver um desses, crie cópias de segurança seguindo as instruções na documentação do ArcGIS Mission Server e na documentação do ArcGIS Notebook Server .
- Cópias de segurança de armazenamento de grandes dados espaço-temporal, armazenamento de gráfico e armazenamento de objeto—se você tiver algum desses tipos ArcGIS Data Store registrado no servidor de hospedagem, crie cópias de segurança de cada um usando o utilitário ArcGIS Data Store backupdatastore.
- Configuração de site do ArcGIS GeoEvent Server—Gerencie as cópias de segurança de sua configuração do ArcGIS GeoEvent Server usando o arquivo de configuração da cópia de segurança.
A maioria das plataformas de virtualização permite a obtenção de capturas instantâneos de máquinas virtuais em execução que permitem objetivos de baixo tempo de recuperação. Embora sejam úteis, elas não são consideradas cópias de segurança duráveis como parte de um plano BC/DR maior.
Ao criar uma cópia de segurança antes ou durante uma janela de manutenção, o objetivo de baixo tempo de recuperação fornecido pelas capturas instantâneas serve como motivação para usar essas ferramentas quando disponíveis. Ao criar cópias de segurança de terceiros, os componentes subjacentes da camada de dados de ambos Portal for ArcGIS e ArcGIS Data Store não têm uma integração com esses métodos e, portanto, envolvem um nível de risco associado a criar cópias de segurança de um banco de dados em execução. Para minimizar esse risco, as capturas instantâneas e as cópias de segurança baseadas em imagem devem ser obtidas após a interrupção do serviço para os componentes do ArcGIS Enterprise em execução.
No caso de arquiteturas que usam um compartilhamento de arquivo para hospedar o diretório de conteúdo do portal compartilhado ou o armazenamento de configuração e os diretórios raiz de sites do ArcGIS Server, é importante considerar a consistência das cópias de segurança desses locais ao usar ferramentas da cópia de segurança de terceiros, como capturas instantâneas da máquina virtual ou cópias de segurança baseadas em imagem. Por exemplo, se um administrador estiver revertendo após uma atualização do Portal for ArcGIS malsucedida recuperando uma captura instantânea, o diretório de conteúdo pode ter sido alterado pelo processo de atualização e não seria mais consistente com as informações contidas no banco de dados da instância recuperada. Para minimizar esses efeitos ao usar ferramentas de terceiros, as cópias de segurança devem ser feitas durante uma janela de interrupção quando nenhum conteúdo estiver sendo publicado ou editado na organização. Isso inclui os componentes do ArcGIS Enterprise, como também, qualquer compartilhamento de arquivo associado.
O ArcGIS Data Store pode ter a cópia de segurança separadamente dos outros componentes para minimizar a perda de dados em caso de falha nesse componente. A execução das cópias de segurança agendadas de armazenamentos de dados relacionais e de cache do mosaico pode ocorrer fora de agendamento do utilitário WebGISDR e de outras ferramentas da cópia de segurança.
Criar cópias de segurança das fontes de dados referenciadas
ArcGIS Server pode servir conteúdo de várias fontes, incluindo geodatabases enterprise, compartilhamentos de arquivos registrados e armazenamentos na nuvem. Essas fontes de dados externas devem ser incluídas no plano de recuperação de desastre para uma implantação. É recomendável que você siga as instruções do fornecedor para fazer cópias de segurança ou replicar dados para outro local.
Geodatabases enterprise e bancos de dados relacionais que contêm dados fornecidos por serviços referenciados devem ser copiados de acordo com os objetivos do ponto de recuperação de cada organização usando as ferramentas fornecidas pelos fornecedores de bancos de dados relacionais. Pelo fato desses dados serem referenciados por serviços do ArcGIS Server, a consistência dos serviços publicados pode potencialmente ficar fora de sincronia com as tabelas do banco de dados de back-end se a recuperação do banco de dados for executada independentemente dos sites que contêm os serviços publicados. Isso torna importante alinhar o agendamento das cópias de segurança em todos os componentes na implantação do ArcGIS Enterprise.
Os compartilhamentos de arquivos de rede podem usar ferramentas de cópia de segurança baseadas em imagem ou em sistema de arquivos para empacotar os dados e depois transferi-los para uma solução de armazenamento durável que exista fora do domínio de falha da implantação.
Os armazenamentos em nuvem devem ser copiados ou replicados para outra região para permitir que você recupere seus conteúdos. Os armazenamentos replicados também podem ser implantados usando arquivamento ou armazenamento frio para reduzir o custo geral.
Ao criar cópia de segurança
A frequência com que uma cópia de segurança é realizada depende de vários fatores, sendo o mais importante o tempo que a cópia de segurança leva para ser concluída. Como os processos da cópia de segurança podem impactar a utilização de recursos do sistema, geralmente as cópias de segurança completas são agendadas fora do horário comercial principal. Para diferentes tipos de cópia de segurança, a frequência com que a cópia de segurança do sistema é realizada pode variar em uma implantação do ArcGIS Enterprise.
Por exemplo, um geodatabase enterprise de produção pode ter uma cópia de segurança incremental a cada 15 minutos para um objetivo de baixo ponto de recuperação. Os dados mais importantes devem ser armazenados nessa instância do banco de dados para reduzir a quantidade de potencial perda de dados. Para uma implantação do ArcGIS Enterprise com muitos serviços referenciados e conteúdo estático, a frequência com a qual as cópias de segurança podem ser realizadas pode ser diariamente ou semanalmente, enquanto para implantações com utilização pesada de serviços da feição hospedados e mapa da web frequente e criação de aplicativos devem ser direcionados a um tempo menor entre as cópias de segurança.
Validar cópias de segurança
As cópias de segurança devem ser monitorados para conclusão bem-sucedida e alertar os administradores quando ocorrer uma falha. Para a ferramenta WebGISDR, o código de saída da execução do script pode ser usado como um medidor para saber se uma cópia de segurança foi concluída com sucesso. Um zero representa uma cópia de segurança bem-sucedida, enquanto qualquer código diferente de zero indica uma falha. Há várias ferramentas de alerta que podem ser integradas para permitir notificações por e-mail ou SMS para a equipe responsável pela integridade da cópia de segurança. Muitas ferramentas da cópia de segurança de terceiros fornecem funcionalidade semelhante ou podem ser integradas a outros serviços para fornecer alertas.
Outro aspecto importante da validação do plano BC/DR de uma organização é executar um exercício de restauração em uma cadência semi regular. Isso ajuda os administradores a garantir que, no caso de um desastre, eles estejam preparados para restaurar a partir das cópias de segurança funcionais e validar o plano de restauração descrito abaixo.
Quanto tempo eu devo manter os arquivos da cópia de segurança
Decidir quanto tempo manter os arquivos da cópia de segurança depende da quantidade de espaço livre em disco que você tem e da flexibilidade que você precisa para as opções de recuperação. Se você não precisar de restauração por um tempo antes da última cópia de segurança completa, você poderá manter a última cópia de segurança completa e as cópias de segurança incrementais criadas desde então.
As cópias de segurança incrementais criadas com a ferramenta WebGISDR são cumulativas; você pode aplicar a cópia de segurança incremental mais recente à última cópia de segurança completa. Então, no mínimo, você precisa reter a última cópia de segurança completa e a cópia de segurança incremental mais recente criada desde esta cópia de segurança completa.
Você também pode mover alguns conjuntos de cópias de segurança mais antigos para outro local, como mídia de armazenamento. Desta forma, se você descobrir que dados e serviços importantes foram excluídos antes da última cópia de segurança completa, você ainda terá os arquivos disponíveis.
Anotação:
O utilitário WebGISDR registra as versões do software de componentes do ArcGIS Enterprise quando você cria uma cópia de segurança. A implantação que você restaurar deve estar na mesma versão quando você criou a cópia de segurança. Adicionalmente, você deve restaurar para o mesmo tipo de sistema operacional. Por exemplo, você não pode criar uma cópia de segurança de uma implantação do ArcGIS Enterprise no Linux e restaurá-la em máquinas do Windows.
Práticas recomendadas para restaurar sua organização
Revise as práticas recomendadas a seguir para restaurar sua organização do ArcGIS Enterprise usando as cópias de segurança que você criou.
O que restaurar
Quando um administrador tem vários tipos de cópias de segurança à sua disposição, é possível restaurar os componentes de maneira mais granular do que reverter toda a implantação. Se o cache de um serviço de mapa ou imagem for excluído, apenas esses arquivos precisarão ser recuperados de uma cópia de segurança. Da mesma forma, se uma tabela for acidentalmente descartada de um geodatabase enterprise, esse banco de dados poderá ser recuperado sem afetar outros componentes.
Se edições incorretas forem realizadas em uma camada de feição hospedada e os dados precisarem ser revertidos, um administrador tem a opção de restaurar apenas o armazenamento de dados relacional sem restaurar toda a implantação do ArcGIS Enterprise. Isso reduz o impacto que a restauração tem sobre outros dados armazenados no banco de dados, mas se houver serviços hospedados criados durante esse período, isso pode fazer com que o site do ArcGIS Server fique inconsistente com as tabelas do banco de dados restauradas e exigir limpeza manual e republicação dos serviços afetados.
Outras vezes, pode haver uma interrupção significativa, como um centro de dados ou região de nuvem, que exige a restauração de toda a implantação do ArcGIS Enterprise, como também, de quaisquer fontes de dados externas. Este seria o exemplo mais extremo e exige um planejamento adequado para garantir a funcionalidade completa do ambiente restaurado.
Como restaurar
Quando uma implantação do ArcGIS Enterprise passa por uma interrupção generalizada, há várias opções de recuperação que dependem dos tipos de cópias de segurança disponíveis. A replicação para um site próximo usando o utilitário WebGISDR é o método mais significativo para reduzir o tempo de recuperação da implantação, enquanto ter um site auxiliar inativo disponível para ativar e restaurar, pode facilitar exercícios de recuperação, como também, reduzir o tempo geral de recuperação.
Ao decidir sobre o caminho para a recuperação, a opção com os objetivos de ponto e tempo de recuperação mais curtos deve ser tentada primeiro. Isso permitiria uma resposta mais rápida sobre o nível de sucesso da restauração. Ter um administrador familiarizado com a estratégia da cópia de segurança que testou restaurações regularmente no passado também pode reduzir o tempo necessário para a recuperação em um cenário de desastre.
Como o ArcGIS Enterprise tem várias camadas em componentes internos e externos, a ordem na qual esses componentes são restaurados influencia a estabilidade da implantação após uma restauração. Todas as fontes de dados referenciadas devem ser disponibilizadas primeiro e devem ser verificadas se estão acessíveis a partir do ambiente do ArcGIS Enterprise, incluindo instâncias do banco de dados e compartilhamentos de arquivos externos, antes de restaurar as máquinas e componentes do ArcGIS Enterprise.
Após as dependências ao redor estiverem em vigor, a implantação do ArcGIS Enterprise deverá ser restaurada para um estado consistente. Isso é para evitar cenários nos quais o site do servidor de hospedagem pode ter um serviço da feição hospedado publicado, mas o armazenamento de dados relacional não tem a tabela de dados dependentes ou a organização pode ter um item para um serviço que não está mais presente em um dos sites federados.
Validação de pré-restauração
Após a conclusão de uma operação de restauração, a validação deve ser realizada para dados críticos de negócios e ampla funcionalidade da implantação do ArcGIS Enterprise. Isso pode ser feito criando listas de verificação para centros de negócios e departamentos para verificar seu conteúdo mais importante ou por scripts automatizados. A abordagem dessa validação usando scripts automatizados permite maior confiança de que a restauração foi bem-sucedida em menos tempo do que uma verificação manual de itens e serviços.
Automatizando as operações da cópia de segurança e restauração
É recomendado criar cópias de segurança regularmente para se proteger contra perdas significativas de dados e reduzir o tempo de inatividade. A frequência com que você criará cópias de segurança será determinada pelo objetivo do ponto de recuperação (RPO) de sua organização, que define quanta perda de dados é aceitável. Por exemplo, se a sua organização não tolerar mais de 12 horas de perda de dados, você definirá uma programação que criará cópias de segurança em uma cadência inferior a 12 horas.
A criação e restauração de cópias de segurança podem ser automatizadas no Linux usando o CronJob ou qualquer outro software de agendamento. Lembre-se que a quantidade de dados em sua organização também afetará a frequência com que você poderá criar cópias de segurança e a rapidez com que pode restaurá-las. Você pode testar quanto tempo levará antes de configurar sua tarefa agendada para garantir que as operações da cópia de segurança ou restauração sejam concluídas antes da próxima tentativa.
Adicionalmente, você deve determinar se as operações da cópia de segurança ou restauração estão sendo bem-sucedidas. A ferramenta WebGISDR suporta um arquivo de saída que registrará os resultados da operação como JSON que pode ser analisado para determinar se a cópia de segurança está localizada, se algum componente falhou e quanto tempo cada componente levou. Esse arquivo pode ser integrado à sua lógica da cópia de segurança e restauração para notificar os administradores sobre quaisquer falhas ou itens de ação.