[vc_row][vc_column][vc_column_text]O monitoramento da infraestrutura de TI é fundamental e abrange muito mais do que servidores. Com a ferramenta certa você também pode monitorar sistemas, serviços, ativos de rede, energia e tudo aquilo que puder ser monitorado.
Hoje vamos falar de Monitoramento de Servidores Windows, físicos ou virtuais.
A ferramenta de monitoramento utilizada será o PRTG.
O que precisamos monitorar em um Servidor Windows?
Neste artigo, vamos falar do monitoramento de um servidor de Arquivos, que é mais básico. Nos próximos artigos falaremos de servidores mais específicos.
A primeira coisa que precisamos saber é se o servidor está “on line”, depois a utilização da CPU, memória e o espaço em disco. Este último é o que geralmente causa as famosas indisponibilidades dos servidores.
Além destes recursos, recomendo monitorar a tempo de atividade (uptime) para saber quando foi a última reinicialização e o trafego de rede, que pode indicar lentidão ocasionada geralmente por alto consumo.
Para complementar o monitoramento da utilização da memória, é muito útil monitorarmos o “page file”, conhecido como memória virtual que é usada quando a memória RAM, ou seja a física não é suficiente. Este é outro grande indicador que sinaliza a necessidade de aumentar a memória física ou em servidores virtuais a vRAM.
Requisitos para monitorar qualquer tipo de servidor Windows
Utilizando o PRTG, não é necessário a instalação de nenhum agente nos outros servidores, pois a comunicação é feita através de protocolos como o SNMP e o mais prático e utilizado, o WMI.
Agora que você já sabe sobre os protocolos utilizados para monitorar, você também vai precisar das credenciais do servidor ou domínio para acessar e coletar os dados.
Configuração dos alarmes e notificações
Agora que você já está monitorando o seu servidor é necessário definirmos quais serão os alarmes de acionamento e o tipo de notificação.
Minhas recomendações são:
Aviso = Warning => para CPU 70% de utilização por mais de 10 minutos
Aviso = Warning => para memória ram menos 30% livre assim que atingir
Aviso = Warning => para disco menos de 25% livre assim que atingir
Critico= Critical/Down => para indisponibilidade do Ping assim que atingir
Critico= Critical/Down => para CPU 95% de utilização por mais de 10 minutos
Critico= Critical/Down => para memória ram menos de 5% livre assim que atingir
Critico= Critical/Down => para disco menos de 10% livre assim que atingir
Principais benefícios de monitorar os servidores:
- Tomar ações preventivas assim que notificar o aviso “warning”, de forma proativa, sem impacto para a empresa.
- Identificar o problema rapidamente
- Saber da ocorrência de algum problema antes mesmo do usuário/funcionário.
- Emitir relatórios de disponibilidade e evidencias para a gerencia justificando a necessidade de um upgrade ou novo servidor.
Resultado visual de um Monitoramento Essencial
Exemplo de relatório Mensal de CPU
Agora que estamos monitorando o essencial e seremos avisados em caso de algum alarme ser acionado. Já podemos dormir tranquilos? Quase 😊
Dentro de um CPD, é importante monitorarmos além dos equipamentos, a energia e a temperatura do ambiente. Estes itens podem ser monitorados por sensores dedicados ou através de nobreaks gerenciados que suportam modulo IP de gerenciamento remoto e ambiental através do protocolo SNMP.
Exemplo de monitoramento de um Nobreak APC, onde estamos monitorando a capacidade da bateria, a tensão de entrada e saída e através do sensor de monitoramento ambiental a temperatura do ambiente:
Mas o que podemos fazer com estas informações? Vejam esta situação:
P: Dorian, são 3 da manhã e chegou uma notificação no meu celular que a energia caiu e tenho somente 30% de bateria, o que eu faço?
R: O novo administrador sempre tem que pensar em automação, (já ouviu falar de DevOps?) o PRTG te ajuda nesta situação. Através de alguns comandos no Powershell, no PRTG é possível atrelar a um evento a ação de desligamento dos servidores e o religamento deles quando a bateria voltar a carregar e estiver acima de 50%.
Monitoramento de servidor Windows (file server) avançado
Monitorar arquivos, pastas e logs
Até agora, vimos o que é possível monitorarmos da parte física do servidor e do ambiente onde ele está localizado, mas podemos ir além e monitorar a parte lógica também, como por exemplo monitorar o tamanho de um arquivo ou pasta, ou até contar quantos arquivos tem determinada pasta ou procurar uma string dentro de um arquivo de log e tomar alguma ação se o arquivo for igual ou maior que X, ou se o arquivo ou log é mais velho que 2hs dentre outras necessidades.
Monitorar Serviços e processos
Vamos imaginar que o seu servidor rode um serviço importante e você quer saber se está online e caso ele pare, seja reiniciado e envie uma notificação para o administrador (lembre-se sempre de automatizar), pois de nada serve saber se ninguém ou algo (Sistema) tomar uma ação frente ao evento.
E quando não é serviço, e é apenas um executável? Perfeito…também é possível monitorar e tomar ações.
Existem inúmeras necessidades e isso vai depender de cada ambiente.
Mas isso é assunto para um outro artigo. No próximo nos aprofundaremos mais.[/vc_column_text][/vc_column][/vc_row]