Como pane em apenas um data center da Amazon causou falhas para iFood, Mercado Livre e mais centenas de empresas

 

Por Lara CasteloVictor Hugo Silva, g1

 

Nuvem da Amazon cai e derruba serviços no mundo todo

Nuvem da Amazon cai e derruba serviços no mundo todo

pane no serviço de computação em nuvem Amazon Web Services (AWS), que durou 15 horas e afetou 500 empresas em todo o mundo na segunda-feira (20), teve esse tamanho por conta da importância do local onde a falha aconteceu.

Segundo a Amazon, o problema começou às 4h11 (de Brasília) e só foi completamente resolvido às 19h01. No Brasil, iFood, Mercado Livre, Itaú e PicPay, entre muitos outros, foram afetados – veja a lista dos serviços de internet que tiveram instabilidade.

A AWS disse que o erro ocorreu na região US-EAST-1, um grupo de data centers no norte da Virgínia, nos Estados Unidos. O local é um dos 38 pontos da Amazon, mas é um dos mais usados devido ao preço baixo e à grande oferta de serviços.

💡 Computação em nuvem é a alternativa usada por empresas que não desejam manter uma grande estrutura para armazenar e processar informações por uma série de motivos, como o alto custo de manutenção.

Ao serem colocados na "nuvem", esses dados estão, na verdade, em data centers (centros de dados) de outras empresas. Na prática, em vez de comprarem os próprios equipamentos, é possível "alugar" a infraestrutura de terceiros como a AWS.

Criada em 2006, a US-EAST-1 é a região mais antiga da rede mundial da AWS, líder na computação em nuvem à frente de Azure (Microsoft) e Google Cloud. Segundo a agência Reuters, ela é definida como local padrão para muitas ferramentas disponíveis no serviço.

💲 O custo do processamento por hora em servidores virtuais da AWS no US-EAST-1 começa em US$ 0,0042 (cerca de R$ 0,023). Na unidade de São Paulo, esse serviço custa quase 60% mais caro do que na do norte da Virgínia, começando em US$ 0,0067 (R$ 0,036).

"À primeira vista, a diferença pode parecer pequena, mas ela se multiplica por milhões de processamentos feitos a cada hora", destacou Thiago Bordini - Diretor de Cyber Threat Intelligence e Prevenção a Fraudes na Cyber Horizon Group.

A diferença nos preços é explicada por fatores regionais como preço da energia, mão de obra e equipamentos, disse Bordini.

👍 Os data centers da AWS têm muitos serviços em comum, mas alguns deles só estão disponíveis em determinados locaisA estrutura do norte da Virgínia, por exemplo, é uma das que conta com a maior oferta de serviços, o que o torna o preferido de muitas empresas.

Vista aérea de um data center da AWS que integra a região US-EAST-1, no norte da Virgínia, nos EUA — Foto: Reuters/Jonathan Ernst

Vista aérea de um data center da AWS que integra a região US-EAST-1, no norte da Virgínia, nos EUA — Foto: Reuters/Jonathan Ernst

Clientes da AWS podem "alugar" diferentes tipos de computadores para armazenar e processar dados, conforme sua necessidade. É possível escolher, por exemplo, equipamentos voltados para serviços de inteligência artificial, segurança ou transmissão de vídeo.

"Alguns serviços precisam de um processamento muito mais potente que outros. É como comparar o uso do Word com o de um programa de edição de vídeos, que exige muito mais capacidade", afirmou Bordini.

Panes globais na nuvem

O erro na AWS foi a maior interrupção em serviços de internet desde julho de 2024, quando uma falha da CrowdStrike afetou sistemas de hospitais, bancos e aeroportos, provocando a famosa tela azul do Windows em sistemas ao redor do mundo.

A própria região US-EAST-1, da AWS, já teve outras interrupções significativas em 2020 e 2021.

A AWS oferece ferramentas para reduzir prejuízos em caso de falhas, mas os desenvolvedores precisam criar sistemas mais tolerantes a esses incidentes, avaliou Ken Birman, professor de ciência da computação da Universidade Cornell, nos EUA, em entrevista à Reuters.

Segundo Birman, muitas empresas cortam custos para lançar um aplicativo e acabam "pulando" a etapa dedicada À proteção contra interrupções. "Essas empresas são as que realmente deveriam ser examinadas depois", opinou.

Falha em computadores causa 'tela azul' em aeroporto de Newark, nos EUA — Foto: Bing Guan/Reuters

Falha em computadores causa 'tela azul' em aeroporto de Newark, nos EUA — Foto: Bing Guan/Reuters

Cada vez mais interconectados, sistemas dos mais diferentes tipos podem enfrentar instabilidades se houver erros em apenas um ponto da cadeia.

"O principal motivo para este problema é que todas essas grandes empresas dependem de apenas um serviço", disse à Reuters Nishanth Sastry, diretor de pesquisa do Departamento de CIência da Computação da Universidade de Surrey, no Reino Unido.

Como a pane da AWS aconteceu

Na madrugada de segunda, foram registradas "taxas de erro significativas" no DynamoDB, sistema de banco de dados da AWS que opera nessas regiões de data centers e é voltado para aplicações que exigem alta velocidade e estabilidade.

Ele consegue processar grandes volumes de dados e muitas requisições por segundo sem que o usuário precise configurar servidores manualmente.

A falha no DynamoDB estava no processo de resolução de DNS, que transforma "nomes de domínio" (como "site.com.br") em números (endereços de IP) interpretados por computadores.

Além disso, empresas tiveram dificuldades para criar novos servidores virtuais no serviço Elastic Compute Cloud (EC2). Como o nome indica, ele tem uma característica "elástica" que permite aumentar ou diminuir a capacidade para executar sistemas conforme necessário.


O erro foi identificado às 4h11 (horário de Brasília) e foi corrigido às 19h01, quando "todos os serviços da AWS retornaram às operações normais", segundo a empresa.

Comentários

Postagens mais visitadas deste blog

Razer anuncia Wolverine Ultimate, o controle para Xbox One e PC mais personalizável do mercado

HyperX lança kit de teclas texturizadas e em novas cores para personalização de teclados gamers

Prepare o bolso! Pré-venda de GTA 6 é listada por mais de R$ 650 na Europa