Nuvem Azure da Microsoft plataforma, seus serviços 365 amplamente usados, Xbox e Minecraft começaram a sofrer interrupções por volta do meio-dia, horário do leste, na quarta-feira, o resultado do que a Microsoft disse ser “uma mudança inadvertida de configuração”. O incidente – que marca a segunda grande interrupção de um fornecedor de serviços de nuvem em menos de duas semanas – destaca a instabilidade de uma Internet construída em grande parte sobre infraestruturas geridas por alguns gigantes da tecnologia.
Os problemas da Microsoft originaram-se especificamente da rede de distribuição de conteúdo Front Door do Azure e surgiram poucas horas antes do anúncio de lucros programado da Microsoft. O site da empresa, incluindo a página de relações com investidores, ainda estava fora do ar na tarde de quarta-feira, e a página de status do Azure, onde a Microsoft fornece atualizações, também apresentava problemas intermitentes.
A Microsoft descreveu em atualizações de status na quarta-feira que passou por um processo de reversão sequencial de versões recentes de seu ambiente até que pudesse identificar a “última configuração válida”. Às 15h01, horário do leste dos EUA, a empresa disse que identificou e promoveu essa configuração estável e que “os clientes podem começar a ver sinais iniciais de recuperação. Atualmente, estamos recuperando nós e roteando o tráfego através de nós íntegros”.
Um porta-voz da Microsoft disse em comunicado: “Estamos trabalhando para resolver um problema que afeta o Azure Front Door e que está afetando a disponibilidade de alguns serviços. Os clientes devem continuar a verificar seus alertas de integridade do serviço.” A empresa não respondeu imediatamente às perguntas da WIRED sobre a natureza da mudança de configuração que causou a interrupção.
Além de ocorrer no dia dos lucros da Microsoft, a interrupção ocorre nove dias depois que a Amazon Web Services, rival do Azure, sofreu uma interrupção massiva que afetou sites e serviços em todo o mundo. Os principais provedores de nuvem, muitas vezes chamados de “hiperscaladores”, padronizam e muitas vezes melhoram a segurança e a confiabilidade básicas para seus clientes, mas problemas e interrupções podem fazer com que eles se tornem pontos únicos de falha para grandes populações de serviços digitais críticos.
“Até a página de status de interrupção do Azure está fora do ar”, diz Davi Ottenheimer, gerente de conformidade e operações de segurança de longa data e vice-presidente da empresa de infraestrutura de dados Inrupt. “Outro erro de alteração de configuração: estamos na era da violação de integridade, mais do que nunca.”
O Azure impediu que os clientes fizessem alterações de configuração em suas instâncias enquanto trabalhava para resolver o problema. A empresa disse em uma atualização de status às 15h22 horário do leste dos EUA que espera “mitigação total” da situação até as 19h20 horário do leste dos EUA.
“As organizações podem pensar que estão isoladas pela escolha do fornecedor de nuvem, mas as dependências são mais profundas”, diz Munish Walther-Puri, membro adjunto do corpo docente da IANS Research e ex-diretor de risco cibernético da cidade de Nova York. “Quando os principais parceiros dependem de outros hiperscaladores, a exposição se multiplica. À medida que a IA se torna a próxima camada da infraestrutura crítica, essas interrupções demonstram a fragilidade da nossa espinha dorsal digital.”








