0

Centreon : superviser un cluster Ceph

Ce mémo décrit la mise en place d’une supervision basée sur Centreon pour superviser un cluster Ceph haute disponibilité sous Proxmox.

Pour ce faire, j’ai configuré le plugin check-ceph-dash sur Centreon et installé ceph-dash sur chaque nœud qui compose mon cluster Ceph.

Mon choix s’est porté sur cette solution car ce couple de scripts m’apporte une grande souplesse pour la mise en service et me permet d’avoir un tableau de bord sur chacun de mes nœuds en plus de ma plateforme de supervision.

Installation de ceph-dash sur les nœuds du cluster Ceph

  • Cloner le script sur chaque nœud :
  • cd opt/
    git clone https://github.com/Crapworks/ceph-dash.git
  • Tester le script :
    cd ceph-dash/
    ./ceph-dash.py
    
    • Exemple de résultat :
    • OK: ceph cluster operates with no problems|bytes_total=71872285999104 num_pgs=1088 data_bytes=13828199913 read_op_per_sec=0 bytes_used=40517853184 num_osds=18 num_up_osds=18 num_in_osds=18 write_op_per_sec=0 read_bytes_sec=0 write_bytes_sec=2040 bytes_avail=71831768145920
      
  • Test de l’interface web de ceph-dash : http://IP_cluster-01:5000
  • Créer un service pour exécuter ceph-dash automatiquement sur les nœuds avec systemd

  • Se placer dans le répertoire des services :
  • cd /etc/systemd/system
  • Créer un service portant le nom du script ceph-dash :
  • nano ceph-dash.service
  • Coller le contenu :
  • [Unit]
    Description=Monitoring Cluster Ceph
    
    [Service]
    Type=simple
    
    ExecStart=/opt/ceph-dash/ceph-dash.py -d
    
    Restart=on-failure
    
    [Install]
    WantedBy=multi-user.target
    
  • Rendre le service exécutable :
  • chmod +x ceph-dash.service
  • Activer le service au démarrage du système :
  • systemctl enable ceph-dash.service
  • Démarrer le service :
  • systemctl start ceph-dash.service
  • Vérifier son statut :
  • systemctl status ceph-dash.service
    ● ceph-dash.service - Monitoring Cluster Ceph
       Loaded: loaded (/etc/systemd/system/ceph-dash.service; enabled)
       Active: active (running) since Wed 2017-03-29 13:21:27 CEST; 1min 9s ago
     Main PID: 147177 (python)
       CGroup: /system.slice/ceph-dash.service
               ├─147177 python /opt/ceph-dash/ceph-dash.py -d
               └─147182 /usr/bin/python /opt/ceph-dash/ceph-dash.py -d
    
    Mar 29 13:21:27 pve-02 systemd[1]: Started Monitoring Cluster Ceph.
    Mar 29 13:21:27 pve-02 ceph-dash.py[147177]: * Running on http://0.0.0.0:5000/
    Mar 29 13:21:27 pve-02 ceph-dash.py[147177]: * Restarting with reloader
    

Installation du plugin check_ceph_dash sur Centreon

  • Installer le paquet python-argpars :
  • yum install python-argparse
  • Se placer dans le répertoire des plugins :
  • cd /usr/lib/nagios/plugins
  • Cloner le plugin check_ceph_dash :
  • git clone https://github.com/Crapworks/check_ceph_dash.git
  • Tester le plugin :
    cd check_ceph_dash/
    ./check-ceph-dash.py --url http://IP-cluster-01:5000
    
    • Exemple de résultat :
    • OK: ceph cluster operates with no problems|bytes_total=71872285999104 num_pgs=1088 data_bytes=13828597225 read_op_per_sec=0 bytes_used=40509227008 num_osds=18 num_up_osds=18 num_in_osds=18 write_op_per_sec=0 read_bytes_sec=2040 write_bytes_sec=2040 bytes_avail=71831776772096
      

Création et configuration d’un service pour superviser un cluster Ceph dans Centreon

  • Créer la commande :
  • Créer le service :
  • Associer le service à un modèle d’hôte :
  • Redémarrer le collecteur :
  • Résultat après quelques minutes quand tout est OK :
  • Résultat avec des soucis sur le cluster Ceph :

Partager l'article :





fred

Administrateur Système autodidacte et utilisateur au quotidien de GNU/Linux (Debian, Ubuntu, Manjaro et un peu de CentOS).

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *