A Amazon, por meio de atualização em seu site de monitoramento do Amazon Web Services (AWS), informou que todos os sistemas do serviço estão em operação novamente.
Nesta segunda-feira (20), uma falha generalizada da AWS tirou do ar diversos grandes sites e serviços online. Segundo a empresa, todos os serviços retornaram ao funcionamento normal pouco depois das 19h (horário de Brasília), após um dia de instabilidade.
O apagão começou às 4h11 (horário de Brasília) na principal região da AWS, US-East-1, localizada no norte da Virgínia (EUA). Estima-se que atingiu pelo menos mil empresas, segundo dados compilados pelo site Downdetector, que monitora falhas online. No pico do incidente, mais de 6,5 milhões de usuários em diferentes países relataram falhas de acesso.
Um aviso na página de status da companhia indicava problemas de DNS no DynamoDB, o serviço de banco de dados que sustenta diversas aplicações da plataforma. O DNS, ou Sistema de Nomes de Domínio (em tradução literal), é responsável por traduzir nomes de sites em endereços IP para que navegadores e aplicações possam carregá-los.

A AWS informou em atualização às 6h01 que um “problema operacional” estava afetando múltiplos serviços e que a equipe estava trabalhando em “múltiplos caminhos paralelos para acelerar a recuperação“. Mais de 70 serviços próprios da empresa foram afetados. Às 7h35, o grupo afirmou que a questão de DNS havia sido “totalmente mitigada” e que as operações estavam voltando ao normal.
Ao longo da manhã, clientes relataram dificuldades para iniciar novas instâncias no EC2, o serviço popular da AWS que fornece capacidade de servidores virtuais. A empresa observou “taxas elevadas de erro” e garantiu que trabalhava para “restaurar totalmente o serviço o mais rápido possível“. Por volta das 14h30, já havia “sinais iniciais” de recuperação em algumas regiões.
De acordo com o Downdetector, usuários relataram problemas em serviços, como Disney+, Lyft, o aplicativo do McDonald’s, The New York Times, Reddit, Ring, Robinhood, Snapchat, United Airlines, T-Mobile e Venmo. Sites do governo britânico, como Gov.uk e o serviço de receita HM Revenue and Customs, também foram afetados.
No Brasil, as aplicações que mais foram afetadas pelo apagão na AWS foram iFood e Mercado Livre, além de serviços, como Alexa, Zoom, Duolingo, Snapchat, Fortnite e Prime Video, que também pararam fora do país.
Um porta-voz do governo do Reino Unido disse à CNBC: “Estamos cientes de um incidente que afeta a Amazon Web Services e vários serviços online que dependem de sua infraestrutura. Por meio de nossos procedimentos de resposta a incidentes, estamos em contato com a empresa, que trabalha para restaurar os serviços o mais rápido possível.”

Leia mais:
- 7 dicas para usar serviços em nuvem da maneira mais eficiente
- O que é a AWS, plataforma da Amazon que apresentou falhas nesta segunda-feira?
- Pane na AWS: especialistas destacam os perigos de um apagão de internet
Áreas internas da Amazon também foram afetadas com a queda da AWS
- A interrupção também afetou ferramentas internas da própria Amazon. Funcionários de armazéns e motoristas do serviço Flex relataram em fóruns que sistemas internos estavam fora do ar em diversos locais;
- Alguns foram instruídos a aguardar em salas de descanso, já que não conseguiam acessar o aplicativo Anytime Pay, que permite o adiantamento de parte do pagamento;
- O Seller Central, plataforma usada por vendedores parceiros da Amazon, também ficou inoperante;
- Outras empresas relataram impactos: o Reddit afirmou estar “trabalhando para restaurar 100% da capacidade”; companhias aéreas, como United e Delta, tiveram clientes sem acesso a reservas; e a plataforma educacional Canvas informou falhas decorrentes do “incidente em andamento na AWS”.
Usuários também relataram problemas em jogos baseados em nuvem, como Roblox e Fortnite, enquanto a corretora de criptomoedas Coinbase teve instabilidades.
A ferramenta de design Canva registrou “taxas de erro significativamente elevadas” e apontou a AWS como causa. O CEO da ferramenta de busca de IA generativa Perplexity, Aravind Srinivas, afirmou que “a causa raiz é um problema da AWS” e que trabalhava para resolvê-lo.
Quais podem ser as causas da pane?
Segundo Rob Jardin, diretor digital da empresa de cibersegurança NymVPN, o apagão provavelmente não foi resultado de um ataque cibernético, mas de uma falha técnica em um dos principais data centers da Amazon. “Esses problemas podem ocorrer quando sistemas ficam sobrecarregados ou uma parte crucial da rede falha, e como muitos sites dependem da AWS, o impacto se espalha rapidamente”, disse.

Mike Chapple, professor de tecnologia da informação (TI) na Universidade de Notre Dame e ex-cientista da NSA, afirmou que, embora o público não conheça o termo DynamoDB, ele “é um dos registradores da Internet moderna”. Segundo ele, as primeiras informações indicam que não houve perda de dados, mas um erro nos registros que informam a outros sistemas onde localizar essas informações.
“Este episódio serve como lembrete de quão dependente o mundo é de um punhado de grandes provedores de serviços em nuvem: Amazon, Microsoft e Google. Quando um grande provedor espirra, a Internet pega um resfriado”, afirmou.
A AWS afirmou que divulgará um relatório detalhado sobre o evento nos próximos dias.
Assista a filmes e séries
Assine Amazon Prime para assistir a filmes e séries populares, incluindo Amazon Originals premiados. O Amazon Prime também inclui a entrega GRÁTIS e rápida de milhares de itens elegíveis, mais de 2 milhões de músicas sem anúncios e muito mais. Clique aqui e comece seu teste GRÁTIS por 30 dias!