maj alert.rules + README

master
greglebreton 2 years ago
parent 924c6f0b99
commit c8cb3061d1
  1. 16
      README.md
  2. 2
      alertmanager/alert.rules
  3. 3
      docker-compose.yml

@ -1,6 +1,14 @@
# PROMETHEUS & GRAFANA # PROMETHEUS & GRAFANA
Ce projet vise à monitorer un server avec une stack Docker. ## FONCTIONNEMENT
Ce projet vise à monitorer un server avec une stack Docker via prometheus pour le scrap des metrics et Grafana pour l'affichage de celles-ci sous forme de graphiques.
Alertmanager est utilisé pour envoyer des alertes mails en fonctions de la configuration contenu dans le fichier alert.rules
Caddy est utilisé pour l'authentification aux divers applicatifs.
Cadvisor est utilisé pour récupérer les informations sur les conteneurs Docker
## CONFIGURATION ## CONFIGURATION
@ -19,4 +27,10 @@ nano alertmanager/alertmanager.yml
nano alertmanager/alert.rules nano alertmanager/alert.rules
``` ```
> Note : Changer les valeurs dans alert.rules concernant le niveau d'alerte pour l'usage CPU ou RAM pour éviter de se faire spammer la boite mail.
> Note 2: Penser à commenter les règles d'alerte non utilisées
## AFFICHAGE
> Grafana est accessible via l'adresse: http://<IP-SERVER>:3000 > Grafana est accessible via l'adresse: http://<IP-SERVER>:3000

@ -121,7 +121,7 @@ groups:
- name: containers - name: containers
rules: rules:
- alert: nextcloud_down - alert: nextcloud_down
expr: absent(container_memory_usage_bytes{name="jenkins"}) expr: absent(container_memory_usage_bytes{name="nextcloud"})
for: 30s for: 30s
labels: labels:
severity: critical severity: critical

@ -37,7 +37,7 @@ services:
volumes: volumes:
- ./alertmanager:/etc/alertmanager - ./alertmanager:/etc/alertmanager
command: command:
#- '--config.file=/etc/alertmanager/config.yml' #- '--config.file=/etc/alertmanager/config.yml' (config par défaut)
- '--config.file=/etc/alertmanager/alertmanager.yml' - '--config.file=/etc/alertmanager/alertmanager.yml'
- '--storage.path=/alertmanager' - '--storage.path=/alertmanager'
restart: unless-stopped restart: unless-stopped
@ -69,7 +69,6 @@ services:
org.label-schema.group: "monitoring" org.label-schema.group: "monitoring"
cadvisor: cadvisor:
#image: gcr.io/google-containers/cadvisor:v0.34.0
image: gcr.io/cadvisor/cadvisor image: gcr.io/cadvisor/cadvisor
container_name: cadvisor container_name: cadvisor
volumes: volumes:

Loading…
Cancel
Save