Gestão de Incidentes e Problemas; Por que da importância desta prática nas operações de TI?
Inicialmente é crucial sabermos a diferença entre um problema e um incidente.
Mais ou menos, pode parecer que um “incidente” e um “problema” são a mesma ocorrência, visto que as palavras nos dão a entender que temos um pepino a resolver, não importa a nomenclatura, o que não deixa de ser verdade!
Logo, para a galera fora do mundo da TI, qualquer uma das palavras pode ser usada para descrever uma situação que está causando impacto negativo no software ou produto, mas, no mundinho expansivo da TI, os dois termos são diferentes e irão ser tratados e gerenciados de formas dessemelhantes, inclusive por cargos e papeis diferentes dentro da companhia. Onde geralmente temos o Incident/manager Expert que irá gerir os incidentes e o Problem/ manager Expert que irá gerir os problemas. Interessante aqui já ressaltar que ambos papeis estão alocados no mesmo time.
Massa! Mas o que é um incidente?
De acordo com o ITIL 4, um incidente é uma paralisação não programada ou redução na qualidade de um serviço. Se formos exemplificar de forma contemporânea em nossa atualidade, podemos definir um incidente quando o WhatsApp ou Instagram apresentam alguma instabilidade em seus serviços, ou seja, por algum motivo ainda não mapeado, algo parou de funcionar e está em certo grau, impactando o cliente ou usuário final.
Bacana, e o que é um problema?
Um problema é a causa raiz de um ou mais incidentes. Uma vez que as diretrizes de escalonamento são ativadas e nenhuma solução é disponibilizada, é possível que seja necessária a abertura de chamado de um problema para áreas responsáveis investigarem a solução. Usando o mesmo exemplo do Insta e WhatsApp, o problema seria uma possível causa raiz daquele único ou mais incidentes que aconteceram e ainda não foram mapeados e investigados a fundo.
Ou seja, funciona como se fosse uma escadinha, onde um incidente ou mais, hierarquicamente pode vir a ser tornar um problema, e com este problema mapeado, seria possível descobrir e resolver o pepino na causa raiz o mais rápido possível.
Sacou?
E como atua o Incident Expert e o Problem Expert em cima do Incidente e do Problema?
O Incident Expert em nosso exemplo, conseguiu de alguma forma apagar o incêndio e restabelecer os serviços do Insta e WhatsApp, mas, sem investigar a causa raiz do motivo.
É aí que entra o Problem Expert, pois dependendo da quantidade de incidentes, será necessário que o mesmo adentre e analise estes incidentes no intuito de encontrar a causa raiz, um denominador comum, para que esse incidente não volte a acontecer, por isso a importância de tais papeis estarem sempre em sinergia.
Há Stakeholders que precisam também estar cientes do gerenciamento da Gestão de Problemas?
Sem dúvida! Principalmente quando temos um chamado de problema aberto onde será necessário o envolvimento e apoio do time de produto e desenvolvimento (P&D), para junto a Gestão de problemas resolver a causa raiz, então, além da sinergia do Incident e Problem Expert, essa mesma cooperação e entendimento precisa existir firmemente entre a Gestão de Problemas e P&D, até porquê caso se trate de um bug no software, nenhuma outra parte precisa ter mais interesse e responsabilidade em resolve-lo do que o time de P&D. Visto que este problema além de estar afetando nativamente o software e o cliente final, poderá virar uma bola de neve na própria fábrica, onerando tempo e pessoas para tratar um problema que antes já havia sido catalogado e monitorado pela Gestão de Problemas.
Por fim, é muito importante que ambos times adotem e criem boas práticas, como FUP semanais ou quinzenais sobre o andamento dos problemas em prol de resolver de forma assertiva, definitiva e conjunta, também, acompanhamento dos problemas através de painéis informativos ou ferramentas de gestão e monitoramento de projetos, dentre outras boas práticas que podem vir a ser essenciais para uma boa gestão de problemas.
Vantagens do Gerenciamento e Gestão de Problemas.
1- Otimização de tempo.
É muito comum que a equipe de TI perca muito tempo resolvendo situações pontuais. Como a gestão de incidentes foca em reestabelecer o serviço o mais rápido possível, sem tratar suas causas, é comum que os incidentes voltem a acontecer em seguida, e isso não é legal, pois dependendo da frequência e do custo, vale mais a pena gastar um pouco mais de tempo para encontrar o problema do que continuar perdendo tempo em incidentes repetitivos. Assim sobra mais tempo para trabalhar e focar em outras demandas.
Recomendados pelo LinkedIn
2- Redução de Custos.
Além de consumir uma porrada de tempo, os incidentes repetitivos também dão muitos custos, não apenas para a TI, mas para a companhia e principalmente para o cliente final, que pode afetar drasticamente, por exemplo, o NPS de um produto e aumentar as reclamações.
Por exemplo, se um produto possui muito bug e isso acontece de forma repetitiva, isso pode afetar a operação das empresas contratantes e sem dúvida gerando gargalos e frustações, com um gerenciamento e gestão de problemas, o cenário poderia ser outro, sem custos desnecessários e com menos reclamações. Ressalto que o tempo gasto em parar um time ou uma pessoa também é um custo, as vezes mais doído que o custo financeiro.
3- Aumento da satisfação dos usuários, clientes internos e externos.
Pode parecer que não, ou até mesmo não ser sentido diretamente pelo Stakeholders, mas uma boa gestão de problemas impacta diretamente na satisfação do cliente, pois um software estável gera valor e agilidade nas operações do cliente, aumentando desta forma sua satisfação e indicação do produto.
As melhores práticas de ITIL indicam a maneira adequada de lidar com incidentes e problemas e são basicamente dividas da seguinte forma, seguida pelo fluxo de processo.
Gestão de Incidentes - Fluxo de Processos. Papel do Incident/Manager Expert
· Registro de Incidentes: A primeira etapa no gerenciamento de incidentes é relatar o incidente identificado. A equipe de TI deve capturar informações completas sobre o incidente usando um modelo de formulário para acelerar o processo de recuperação.
· Classificação de Incidentes: Segmente os incidentes com a categoria e subcategoria adequada para facilitar a identificação. Personalize o formulário de incidente com os campos certos e configure regras automatizadas para classificação, priorização e atribuição de tíquetes.
· Priorização de Incidentes: Estabeleça uma definição realista de SLA para atender aos compromissos do cliente.
· Investigação e Diagnóstico: Quando um chamado de incidente é aberto, a equipe de TI realiza uma análise inicial e envia uma resolução ao usuário final. Se necessário deve-se escalar o chamado de incidente para equipes de nível II e nível III para investigação mais detalhada.
·Resolução e fechamento de chamados de incidentes: Um dos principais objetivos de qualquer equipe de TI é resolver qualquer incidente o mais rápido possível. A comunicação eficiente sobre a resolução e o fechamento dos chamados resolvidos é muito importante.
Gestão de Problemas - Fluxo de Processos. Papel do Problem/Manager Expert
·Identificação proativa de problemas: Melhore a disponibilidade geral dos serviços identificando problemas de forma proativa para que possam ser resolvidos antes que futuros incidentes ocorram.
·Diagnóstico e resolução de problemas: Identifique a causa raiz de um problema e aplique a solução mais apropriada.
·Controle de problemas e erros: Monitore constantemente os problemas pendentes para que quando necessário, medidas corretivas possam ser introduzidas.
·Encerramento e avaliação do problema: Certifique-se de que, após a solução de um problema, o registro contenha uma descrição histórica completa e que a base de conhecimento seja atualizada.
·Revisão do problema principal: Analise a resolução do problema para garantir que as situações problemáticas tenham sido totalmente eliminadas. Identifique as ações preventivas (como mudanças no processo) que devem ser realizadas para evitar a recorrência do problema.
·Relatórios de gestão de problemas: Informe todas as áreas de TI sobre os problemas pendentes, seus status e soluções existentes.
Por fim, a gestão de problemas concebe um ganho ao produto e clientes, considerando que havendo um bom gerenciamento dos problemas será notável que as soluções virão de forma mais assertiva e processual, podendo ser mensurado e acompanhado através de indicadores. Através disso, gerando novas ideias, melhorias contínuas no software e agregando valor ao mesmo. Ainda, garantido que quaisquer incidentes e problemas sejam rapidamente catalogado e resolvido na mesma velocidade.
Coordenador de suporte | TOTVS
1 aMuito bom o texto Lindria, prático e funcional, Parabéns!
Tech Manager - Support, Operations and Product Development
1 aExcelente artigo Bruno Lindria. Leitura fácil e agradável... Vamos juntos...
Diretor de Operações, Serviços, Suporte e Cloud na TOTVS S/A
1 aChega a ser emocionante ler este artigo e depoimento , e como o desenvolvimento destas habilidades evoluíram os grandes profissionais de nosso grupo de Goiânia. Parabéns Bruno, vocês é um dos destaques e que tem ajudadado e alevar a credibilidade do suporte e focar nas soluções de causa raiz.