Possível Falha na Gestão de Mudanças na CrowdStrike Gera Bilhões em Prejuízo Global

O apagão causado pela atualização defeituosa no software Falcon da CrowdStrike afetou diversos setores ao redor do mundo. Confira abaixo os principais setores afetados:

Aviões: Cerca de 5.078 voos foram cancelados globalmente, com problemas em aeroportos como Sydney, Melbourne, e Christchurch, causando grandes atrasos e interrupções nos sistemas de check-in.

Setor Financeiro: Bancos e instituições financeiras tiveram operações interrompidas, dificultando transações e acesso a serviços bancários.

Mídia: Veículos de comunicação enfrentaram dificuldades técnicas, impactando a transmissão de conteúdos e operações internas.

Empresas de Tecnologia e Usuários do Microsoft Windows: Aproximadamente 8,5 milhões de dispositivos foram afetados, levando à interrupção de serviços e perda de dados em várias organizações.

Empresas de Saúde: Hospitais e clínicas relataram problemas em acessar registros eletrônicos de saúde e outros sistemas críticos.

Estimativas apontam que o prejuízo global causado pela falha da CrowdStrike alcançou a casa dos bilhões de dólares. 

Especialistas em cibersegurança da TERA Tecnologia,  apontam possíveis falhas na gestão de mudanças, como testes insuficientes, gerenciamento de configurações inadequadas, comunicação ineficiente, incompatibilidade com sistemas legados, desenvolvimento, falta de contingência e plano de recuperação e etc.

A gestão de mudanças refere-se a um conjunto de processos e políticas que visam garantir que todas as alterações nos sistemas e na infraestrutura de TI sejam feitas de maneira controlada e segura,  minimizando os riscos associados a mudanças não autorizadas ou mal implementadas que possam comprometer a segurança dos dados e sistemas.

Assim, alguns cuidados de gestão de mudança devem ser observados:

Planejamento Detalhado:

Realizar uma análise de impacto abrangente para identificar todos os sistemas e processos que podem ser afetados pela mudança. Desenvolver um plano de contingência para lidar com potenciais problemas durante a implementação da mudança.

Teste e Validação:

Conduzir testes extensivos em um ambiente de pré-produção que simule o ambiente de produção o mais próximo possível. Validar os resultados dos testes com stakeholders chave para garantir que todas as funcionalidades críticas estejam operando corretamente.

Comunicação Eficaz:

Informar todas as partes interessadas sobre a natureza da mudança, o cronograma e os possíveis impactos. Manter uma linha de comunicação aberta durante toda a implementação para resolver problemas em tempo real.

Treinamento e Documentação:

Treinar a equipe de TI e os usuários finais sobre as novas funcionalidades e mudanças no sistema. Fornecer documentação detalhada sobre a atualização, incluindo procedimentos de recuperação de falhas.

Aprovação e Governança:

Obter a aprovação formal da alta administração e dos comitês de governança antes de implementar mudanças significativas. Garantir que todas as mudanças sejam documentadas e rastreáveis para auditorias futuras.

Monitoramento Pós-Implementação:

Monitorar o sistema de perto após a implementação da mudança para identificar e resolver rapidamente quaisquer problemas que possam surgir. Realizar uma revisão pós-implementação para avaliar o sucesso da mudança e identificar lições aprendidas.

Gestão de Riscos:

Identificar e avaliar riscos potenciais associados à mudança e desenvolver estratégias para mitigar esses riscos. Implementar controles adicionais, como backups e redundâncias, para garantir a continuidade do negócio em caso de falha.

Postado em Tera Talks.