Eu preciso monitorar os ativos de TI da minha empresa?
E aí pessoal, tudo na paz?
Nesse meu primeiro artigo aqui no Linkedin, gostaria de destacar a importância do monitoramento do seu ambiente de TI e principalmente bancos de dados, tecnologia que sou fascinado! :)
Trabalho há mais de 10 anos com TI e em alguns dos lugares onde trabalhei ou tive a oportunidade de prestar serviços de consultoria, percebi a ausência de uma rotina de monitoramento e de uma pessoa, seja de Infra ou DBA, com know how para implementar uma estratégia e ferramenta de monitoramento.
O monitoramento é vital para a saúde do ambiente de TI e para o sucesso da organização. Ele deve ser desenvolvido pela sua equipe de TI ou uma empresa especializada em conjunto com sua equipe de negócio, e deve estar alinhado a estratégia organizacional.
Alguns benefícios do monitoramento:
- Compreender seu ambiente e identificar gargalos onde deve-se atuar com mais intensidade
- Fazer projeções para o futuro
- Justificar investimentos de TI ou outras áreas com base em dados e fatos
Costumo dizer que monitorar ativos de TI abrange, mas não se limita a:
- Identificar o que precisa ser monitorado (TI e negócio).
- Coletar, armazenar os dados e usá-los em ferramentas para gerar alertas (se necessário).
- Interpretar dados, gerar informações e criar uma linha de base (baseline).
- Com posse das informações, avaliar a evolução e melhorias, fazer projeções de crescimento e traçar metas para o futuro agindo preventivamente evitando incidentes
Você: "Ta bom, muito bacana isso tudo! Mas por onde começar?!"
Vamos lá, primeiro você precisa entender que seu ambiente muda o tempo todo, está em constante crescimento e precisa de passar por uma análise, para depois ser controlado e monitorado.
Pensando nisso, devemos identificar os principais ativos para o funcionamento da organização (olha o servidor de banco de dados aí!) e começar a estratégia por eles. Mas esses ativos precisam apenas estar ligados e disponíveis ou temos um requisito mínimo de desempenho para que a equipe de negócio faça bem e no tempo desejado o seu trabalho, sem depois "jogar a culpa" que o sistema estava lento?
Considerando essa situação, devemos traçar os limites (threshold, termo muito usado em TI) aceitáveis para o bom funcionamento do sistema. Depois disso, precisamos escolher como vamos monitorar para definir qual a ferramenta nos atende?
Decidimos não reinventar a roda, então vamos utilizar uma ferramenta específica para tal tarefa. Ainda mais que no mercado hoje existem várias ferramentas de monitoramento de ativos de TI e também outras especificamente para bancos de dados.
Tratando a TI (Servidores, switches, impressores, bancos de dados, etc...) como um todo hoje utilizo o Zabbix para fazer coleta e análise de dados, integrado com Telegram, Slack e e-mail para gerar o alerta caso ultrapasse algum limite, um dashboard desenvolvido no Grafana para a camada de apresentação das informações e o software IBM Maximo para abertura de tickets/incidentes classificando e direcionando para a equipe responsável pelo ativo.
O Zabbix é uma excelente ferramenta, open source, que integra com vários serviços de mensagens e aplicações de controle de chamados, mas sua implementação pode ser um tanto complexa pois exige uma certa experiência em sistemas operacionais, shell script, powershell, redes, contadores de desempenho, linguagem de programação, entre outras habilidades.
Abaixo segue uma visualização de um dos dashboards (dados de um ambiente de teste) que desenvolvi e utilizo para monitorar servidores com SQL Server aqui na Maxinst.
Nesse painel, monitoro se os serviços do SQL Server, espaço em disco, estatísticas e waits de banco de dados, jobs executando há mais de uma hora e jobs que falharam, locks entre outros contadores.
Para cada informação coletada configurei um threshold classificado por severidade e dependendo da configuração e do dado coletado recebo um tipo de alerta diferente, segue por exemplo, uma mensagem recebida através do slack.
Enfim, com o Zabbix é possível monitorar diversos itens, desde a temperatura do seu CPD, servidores e outros equipamentos de TI, até a quantidade de impressões feitas na sua sala.
Esse artigo é apenas uma introdução sobre o assunto, um estímulo para você bater um papo sobre monitoramento na sua organização e te dizer que estou à disposição também para qualquer dúvida, ajuda ou apresentação.
Um abraço.
Vinícius Fonseca
Em breve colocarei novidades em meu blog. Clique aqui para acessá-lo.
Data Engineer | Data Architect | 2x Microsoft Certified | Azure
2 aComo sempre, excelente artigo... Quando se tem só fera nos comentários já indica que o cabra é mestre!
Cloud Architect @ Offerwise | Serverless | Terraform | Cloudformation | DevSecOps
6 aFaltou comentar que essa dashboard é do Grafana! #paz
Market Research Analyst / Data Analyst
6 aOlá, outra ferramenta bacana, mas complexa pra implementar é o Nagios.
Database Engineer
6 aColoca um Power BI ai ;)
Microsoft MVP | Microsoft Certified as: Azure Solutions Architect Expert, Azure Data Engineer, Azure Administrator, Database Administrator, Enterprise Data Analyst & Power BI Data Analyst
6 aExcelente artigo. Muito bom mesmo. Parabéns!!!