- A proposta do desafio foi implementar no cluster todo o monitoramento do ambiente, incluindo recebimento de diversas métricas com o Prometheus, criação de dashboards no Grafana, geração e coletas de logs pelo Loki/Promtail, gerenciamento de alertas com AlertManager, e recebimento de notificações pelo Slack.
- Prometheus
- Grafana
- AlertManager
- Loki
- Promtail
- Slack
- Apis de Clientes, Produtos e Endereços e Inventário.
- Node-Exporter
- Kube-state-metrics
- Node-exporter
- kube-state-metrics
- Requests APIs
- Logs do cluster
- Alerta de verificação se o serviço das aplicações estão rodando.
- Alerta de verificação se falta menos que 10% de utilização dos Nodes.
- Alerta de verificação se a carga de CPU for maior que 80%.
- Alerta de verificação se existe Pods falhos.
- Alerta de verificação se existe Nodes falhos.
- Alerta de verificação se exister Deployment falho.
- Loki envia os logs do cluster para o Grafana.
- Promtail é o agentes que coleta e envia os logs dos nodes.
- Recebe os alertas do Alertmanager no canal #douglas-bruno.