06/07/2006
O sistema caiuEste texto tem como objetivo discutir o impacto que pode gerar um sistema fora do ar e propor meios de prevenção para “quedas” indesejáveis. A frase “o sistema caiu”, dentro de um contexto não crítico, pode ser apenas um aborrecimento a mais para o usuário. E quando o sistema é de extrema importância e pode paralisar uma produção ou gerar perda de negócios?
Vivemos em uma época em que as empresas dependem cada vez mais da informática, principalmente da Tecnologia da Informação. Essa dependência gera uma cobrança maior por parte dos executivos com relação à disponibilidade e estabilidade dos sistemas que, por sua vez, deixaram de ser pequenos e locais para se tornarem grandes sistemas em redes compartilhadas.
Em um ambiente Web, por exemplo, um sistema pode estar sendo usado simultaneamente por milhares de usuários, o que expande os valores de responsabilidade uma vez que, num mercado concorrente, quem tem o melhor serviço ganha o cliente. Poucos minutos podem gerar não só perdas financeiras como prejudicar seriamente a imagem de uma empresa.
Um bom exemplo foi o do terceiro maior corretor mundial on-line, que mantinha aproximadamente 60 mil negócios/dia. Por conseqüência de 75 minutos parado em um dia, intervalos de inatividade no dia seguinte e 29 minutos inativo no terceiro dia, sofreu duas ações jurídicas e uma queda de US$ 62 para US$ 48 nas ações da empresa (Fonte: Pressman, R., Software Engineering: A Practitioner’s Approach, 2000).
É claro que nenhum sistema ou tecnologia é a prova de falhas, mas algumas medidas podem ser tomadas para diminuir o tempo de ação sobre um eventual problema. Um bom começo pode ser o trabalho com foco mais preventivo do que corretivo:
. Elaboração de checklist de verificações antes dos sistemas entrarem em produção efetiva, podendo conter verificações diárias de alertas visuais de falhas de hardware, logs de erro de sistemas e bancos de dados;
. Automatização de monitoramentos através de ferramentas que podem alertar falhas iminentes para um menor tempo de resposta ao problema;
. Testes de atualizações intensivos antes que as mesmas entrem em produção é outra boa forma de evitar problemas;
. E o mais importante: comunicação entre as equipes de informática sobre as alterações que estão sendo realizadas, facilitando o processo de identificação do problema.
Pode-se concluir assim que um sistema não é nada se não houver o lado humano envolvido. Comunicação, prevenção e envolvimento da equipe são peças essenciais para o bom funcionamento. Isso muda o conceito de que somente gastos com tecnologia são suficientes para se manter um serviço de qualidade.
Fonte: TiMaster
Imprimir Artigo
Voltar