fbpx

Infraestrutura responsiva: como planejar a alta disponibilidade do ambiente

Quando falamos em utilização da nuvem, os benefícios mais procurados pelos executivos é a escalabilidade, a baixa latência e a alta disponibilidade. Isso significa ter um ambiente robusto que independentemente da quantidade de usuários ativos simultaneamente, continuará ativo e rodando sem travas e falhas no sistema. 

A nuvem pública como infraestrutura por si só já indica estar em uma posição mais favorável neste quesito. Mas, além de sua adoção é preciso ter um planejamento estruturado para que não haja possibilidade de quedas também se faz essencial.  

Recentemente, vimos alguns casos de empresas que tiveram suas operações paralisadas por conta da falta de disponibilidade e de planejamento de contingência. Ter sistemas não operantes é sinônimo de prejuízo financeiro para as companhias e, em alguns casos, para os seus clientes – gerando custos em cadeia que podem levar tempo para serem abatidos após a volta à normalidade.  

Um exemplo clássico do quanto um sistema parado pode comprometer os resultados financeiros é a Black Friday. A maior data varejista do ano move centenas de milhares de consumidores em busca de aproveitar as melhores ofertas no e-commerce – o que gera uma demanda muito mais alta do que datas comemorativas em outros meses do ano. Neste dia, cada minuto de indisponibilidade pode resultar em milhões de reais em prejuízo. Com isso, a infraestrutura tem que estar preparada para atender aos clientes nos momentos de pico de ofertas e transações da mesma forma que atende ao consumidor que faz a sua compra na madrugada de um dia qualquer.  

Para que seja feita a construção de um ambiente de alta disponibilidade, os profissionais de tecnologia têm a sua disposição a metodologia Well-Architected Framework (WAF) ou, em português, Estrutura Bem Projetada. Com ela, é possível identificar as melhores práticas em relação à disponibilidade, segurança, otimização de custos, excelência operacional e performance. No módulo de disponibilidade, os desenvolvedores podem identificar dicas de planejamento da infraestrutura, padrões de design de resiliência, tratamento de falhas e como realizar a previsão de disponibilidade das aplicações e do provedor para que não haja surpresas em momentos importantes para o seu negócio. 

Como primeiro passo deste planejamento, destaco aqui a identificação das aplicações mais críticas para a operação da empresa. Ou seja, aquelas que não podem ter problemas, pois isso afetaria todo o ambiente da companhia. Com esta informação em mãos é o momento de avaliar o seu SLA (Service Level Agreement), ou Acordo de Nível de Serviço, em português. Trata-se de um contrato de mútuo acordo entre o fornecedor de nuvem e a empresa contratante no que tange à quantidade de tempo, digamos, aceitável para que uma aplicação possa ficar fora do ar anualmente. Isso também dita o esforço das equipes de tecnologia em aumentar a disponibilidade da aplicação, de acordo com o seu valor, para a infraestrutura como um todo.  

Os SLAs geralmente são medidos de forma percentual na casa de 99%, em que 99,5% significa que a aplicação pode ou está ficando horas inoperável ao longo de um ano, e 99,995% são apenas poucos segundos com o sistema paralisado. Assim, quanto mais noves houver no percentual, maior a sua taxa de disponibilidade.  

Outra questão a ser levada em consideração é ter uma réplica de todo o seu ambiente em outra região de datacenter. Por exemplo, a Microsoft possui duas regiões de nuvem Azure no Brasil, são elas: a Brazil South que fica localizada no estado de São Paulo; e a Brazil Southeast que fica no Rio de Janeiro. A última, disponibilizada em outubro de 2020, é exclusiva para recuperação de desastres para aplicações de missão crítica. Assim, os clientes podem replicar as suas aplicações para terem tolerância a falhas e recuperarem todas de maneira fácil sempre que precisarem. Ou seja, caso uma pare por alguma falha, terá outra região com a aplicação replicada que rodará normalmente. 

Além disso, anunciamos recentemente as Zonas de Disponibilidade na região Brazil South que consistem em data centers com energia, resfriamento e rede independentes para que os ambientes ali alocados estejam assegurados em casos de falhas de nível local nos servidores.  

Desde a implementação das zonas e da Brazil Southeast vimos na nossa operação uma diminuição de 90% na latência e um aumento de mais de três vezes em capacidade da nossa nuvem no país.  

Em suma, ter um ambiente em nuvem confiável, com capacidade local expressiva é de extrema importância, mas todos estes outros pontos também devem ser alinhados. A terceirização de armazenamento traz uma série de benefícios, mas também é preciso que as equipes de tecnologia estejam atentas, e por dentro dos processos internos para analisar o que pode melhorar, testar suas aplicações e criar planos de contingências estruturados.  

Quando pensamos em paralisação de ambientes, costumamos pensar em ataques cibernéticos – que de fato acontecem – mas a falta de disponibilidade também é um desafio a ser levado a sério. Acredito que com os recursos da nuvem e a devida atenção ao tema, teremos operações mais eficientes e clientes mais satisfeitos com os serviços prestados. 

Compartilhe:

Share on facebook
Share on twitter
Share on linkedin
Share on telegram
Share on whatsapp
Share on email

Veja Também:

© 2020 ALL RIGHTS RESERVED | SITEZINHO

WhatsApp chat
Já vai ? Receba uma proposta exclusiva com desconto.

Quer 50% de desconto?