Categorias

Gerenciando uma crise de TI na sua empresa

Nenhuma empresa, por mais blindada que seja, está 100% livre de uma falha de software de terceiros, um problema de hardware, uma queda na internet ou mesmo um ataque eletrônico. Saber o que fazer antes, durante e depois de uma crise pode representar toda a diferença entre uma boa equipe de TI e uma equipe despreparada.

Então, não se trata de imaginar o que aconteceria se uma crise aparecer, mas imaginar o que acontecer quando a crise aparecer. Um erro de procedimentos pode enterrar um negócio, comprometer clientes, avariar a confiabilidade de seu produto ou serviço e comprometer o futuro de toda a operação.

De acordo com o jornalista e professor de pós-graduação, João José Forni:

Crise não são problemas, pois alguns deles você consegue muito bem administrá-los, como qualquer coisa do seu dia a dia. No entanto, os problemas podem se transformar em crise quando não bem administrados. A crise nada mais é do que uma ruptura violenta com a normalidade de qualquer situação (…) Quando acontece, pode inclusive acarretar em repercussão na segurança e na vida das pessoas. Ela se caracteriza por um impacto muito grande no negócio, que pode gerar sérios danos e acabar com uma empresa

Especialistas da área que já vivenciaram todo tipo de problemas compartilharam sua experiência e podem oferecer uma luz sobre a melhor resposta para eventos que poderiam ser catastróficos.

Antes da crise

“Muitas vezes, lidar com uma crise de segurança pode estar em preparação”, diz Ron Winward, evangelista de segurança da Radware. “Mesmo se você não tiver um orçamento de segurança, ainda poderá planejar o que fará se encontrar um problema de segurança. Entenda quem precisa ser notificado, interna e externamente, bem como quem estará envolvido em sua resposta. Então pratique. Esses primeiros minutos e horas serão críticos para como você se sai sob pressão”.

“Se você for atingido com vírus, ransomware ou corrupção de dados, conte com snapshots para restaurar seus dados, revertendo para alguns minutos, horas ou um dia antes”, aconselha Kevin Liebl, vice-presidente de marketing da Zadara Storage. “Dependendo da frequência com que você define os níveis de snapshots, talvez não seja possível restaurar tudo, mas pelo menos você terá um caminho rápido para a restauração parcial”.

É bom ficar atento ao modelo de backup utilizado. De acordo com a consultoria Introduce, “nem toda solução de Backup é orientada à recuperação de desastres. É preciso ter em mente que suas cópias não podem levar horas e horas a fio até serem restauradas”. E eles aconselham: “para que a rotina de Backup seja eficaz e sua empresa se recupere de qualquer problema, é necessário que as cópias possam ser restauradas rapidamente e o negócio volte a funcionar em pouco tempo”.

Uma arquitetura sólida baseada em múltiplas camadas de nuvem montada previamente também pode oferecer soluções satisfatórias para uma crise de TI. Liebl aposta nesse caminho:

Se o seu sistema baseado em nuvem tiver uma interrupção e você tiver configurado a arquitetura de failover adequada, poderá simplesmente redirecionar seus aplicativos e / ou dados para um provedor de serviços em nuvem alternativo. Ter uma arquitetura de várias nuvens é muito inteligente para evitar pontos únicos de falha. Como alternativa, muitos arquitetos baseados na nuvem recomendam uma abordagem híbrida na qual os dados críticos são espelhados de forma síncrona entre a nuvem e o armazenamento local. Dessa forma, você pode realizar failover entre a nuvem e uma cópia local dos seus dados.

Monitoramento também é outra ferramenta importante para diminuir a incidência de crises, como destaca a consultoria B2Card: “softwares de monitoramento são aqueles que verificam a qualidade dos módulos utilizados por sua empresa. Eles avaliam a qualidade das redes, performance de máquinas e enviam alertas para o administrador dos sistemas caso qualquer um deles apresente anomalias”. E completa: “monitorar ativamente seus sistemas será um investimento inteligente, pois ajudará a poupar no futuro. Com monitoramento sua TI sabe quando, como e onde agir antes que uma crise apareça”.

Durante a crise

A primeira dica para lidar com uma crise uma vez que ela está acontecendo é não perder o foco. Esse é um conselho de Jake Bennett, CTO da POP, para a liderança de TI: “é absolutamente crítico para a liderança sênior de TI manter a calma e o foco. Todos na equipe estão sob um nível extremo de estresse durante uma interrupção, e isso pode levar a erros. No entanto, você precisa da equipe para dar o melhor de si naquele momento”. E alerta: “se você parecer estar perdendo o controle, levará sua equipe consigo e levará muito mais tempo para resolver o problema”.

Em contrapartida, David Cox, CEO da LiquidVPN, destaca que “microgerenciar sua equipe quando houver pressão levará ao desastre. Uma abordagem melhor é realizar uma reunião de 10 ou 15 minutos, dividir o trabalho em seções, atribuir trabalho a cada membro da equipe e mantê-lo focado em suas tarefas”.

Os especialistas também aconselham não utilizar esse momento para procurar culpados, para não diminuir o empenho do time. De acordo com Eric Hobbs, CEO da Technology Associates, “se você começar a inventar desculpas sobre o que causou o problema ou apontar os dedos, isso diminuirá a confiança. Haverá muito tempo para um post-mortem mais tarde”.

A crise de TI pode ter repercussões externas e esse é um aspecto que não pode ser negligenciado jamais. O que começou com um problema interno pode se transformar em um desastre de relações públicas que compromete a relação com o consumidor.  Kimberly Nissen, presidente da P​ublic Relations Society of America, destaca que é importante envolver o time de Relações Públicas da empresa o mais rápido possível em crises com potencial de atingir clientes: “quanto mais cedo se tiver conhecimento de uma situação, mais tempo se terá para coletar os fatos e trabalhar com o departamento jurídico para preparar uma declaração pública. Ter essa declaração em espera, caso o incidente se torne público, é crucial”.

Essa preocupação encontra eco na consultoria Ever It, que destaca que:

Comunicações efetivas podem ser a diferença entre o pânico e uma tranquila responsabilização de emergência, sem pânico. Crie um conjunto de comunicação que englobe todos os canais utilizados, incluindo telecomunicações, e-mail, endereço público, intranet, mensageiros e o site da empresa. Além disso, tenha modelos de mensagens de emergência prontos para serem atualizados rapidamente em uma situação de urgência, e claro, certifique-se de ter preparado uma mensagem consistente para o público também, seja por press release, mídia social ou ainda entrevistas

A consultora de gerenciamento Amy Cooper Hakim, dá exemplos de uma comunicação vital e uma resposta adequada: “se o seu servidor de email for invadido e toda a sua lista de clientes receber spam do endereço de email da sua empresa, envie rapidamente um email global para que seus clientes saibam. Verifique se a linha de assunto é clara e direta. Escreva algo como: ‘Por favor, não abra um e-mail nosso com [x] na linha de assunto’. Em seguida, no corpo da mensagem, confirme o erro. Peça desculpas e assuma a responsabilidade (mesmo que a culpa não seja sua). Os clientes esperam que ocorram erros. É seu trabalho impressioná-los na recuperação”.

Após a crise

Da mesma forma que os usuários foram informados da existência da crise, é importante que eles sejam informados que o problema foi resolvido. Esse também é um bom momento para uma explicação mais completa do incidente, em termos que sejam compreensíveis mas detalhados o bastante para oferecer uma ideia do que aconteceu nos bastidores.

Tanto interna quanto externamente, é fundamental avaliar os erros. Para a consultoria QI Network, “aprender com os erros é um sinal de maturidade de uma empresa. Passar pelos desafios deverá deixar a organização mais forte e confiante frente aos problemas que surgirão. Insira a situação e como esta foi tratada no seu planejamento, deixando-o mais robusto e já preparado no caso de o problema aparecer novamente”.

Segundo Rachel Obstler, vice presidente de produto da PagerDuty, “Use esse tempo para avaliar o que funcionou bem no seu processo de resposta a incidentes e o que não funcionou, bem como maneiras de proteger o sistema contra incidentes dessa natureza no futuro,  aperfeiçoando e otimizando a resolução de incidentes”.