4

Proxmox : supprimer et recréer un nœud

Pendant une nouvelle installation de Proxmox, je fus confronté à un problème de communication pendant la mise en place d’un cluster entre deux nœuds Proxmox.

Problème Waiting for quorum… Timed-out waiting for cluster

Le message d’erreur en question :

Starting cluster:
   Checking if cluster has been disabled at boot... [  OK  ]
   Checking Network Manager... [  OK  ]
   Global setup... [  OK  ]
   Loading kernel modules... [  OK  ]
   Mounting configfs... [  OK  ]
   Starting cman... [  OK  ]
   Waiting for quorum... Timed-out waiting for cluster
[FAILED]
waiting for quorum...

Dans le cas présent, les deux nœuds ne sont pas configurer en Haute Disponibilité, juste en mode cluster pour administrer dans une seule interface web les deux nœuds. Donc, dans cette configuration je n’ai pas besoin d’un Quorum. Cependant, il y a bien un problème de communication ou de configuration sur un des deux nœuds.

Vérification de la configuration des deux nœuds Proxmox

Les premiers fichiers à vérifier sur les deux noeuds sont /etc/hosts et /etc/hostname. Pour optimiser la communication réseau entre les deux noeuds, il est possible d’ajouter le nom et l’adresse IP entre les deux nœuds, comme suit :

    • Sur le nœud 1 :
127.0.0.1 localhost.localdomain localhost
10.10.10.4 proxmox-01.domaine.tld proxmox-01 pvelocalhost
10.10.10.5 proxmox-02.domaine.tld proxmox-02

et vérifier son hostname :

hostname
proxmox-01
    • Sur le nœud 2 :
127.0.0.1 localhost.localdomain localhost
10.10.10.5 proxmox-02.domaine.tld proxmox-02 pvelocalhost
10.10.10.4 proxmox-01.domaine.tld proxmox-01

et vérifier son hostname :

hostname
proxmox-02

Dans mon cas, j’avais écris un mauvais nom dans le fichier /etc/hosts.

Supprimer un nœud

Si on essaie de supprimer le nœud directement, on peut avoir ce message d’erreur :

pvecm delnode proxmox-01
cluster not ready - no quorum?

Voici la méthode pour supprimer un nœud Proxmox, à faire sur le nœud 2 :

pvecm expected 1
pvecm delnode proxmox-01

Personnellement, j’ai réitéré les commandes sur l’autre nœud, histoire de me retrouver dans la situation de départ.

Ajouter de nouveau un nœud au cluster

Si on exécute de suite la commande pvecm add, on peut avoir ce message d’erreur :

pvecm add proxmox-01
authentication key already exists

En fouillant das le man, c’est indiqué qu’il faut ajouter l’option -force :

pvecm add  proxmox-01 -force
The authenticity of host 'proxmox-01 (10.10.10.4)' can't be established.
ECDSA key fingerprint is 66:c6:b7:01:e2:dd:89:e7:37:6a:26:45:9d:d9:77:ad.
Are you sure you want to continue connecting (yes/no)?

On répond yes :

copy corosync auth key
stopping pve-cluster service
Stopping pve cluster filesystem: pve-cluster.
backup old database
Starting pve cluster filesystem : pve-cluster.
Starting cluster: 
   Checking if cluster has been disabled at boot... [  OK  ]
   Checking Network Manager... [  OK  ]
   Global setup... [  OK  ]
   Loading kernel modules... [  OK  ]
   Mounting configfs... [  OK  ]
   Starting cman... [  OK  ]
   Waiting for quorum... [  OK  ]
   Starting fenced... [  OK  ]
   Starting dlm_controld... [  OK  ]
   Tuning DLM kernel config... [  OK  ]
   Unfencing self... [  OK  ]
generating node certificates
merge known_hosts file
restart services
Restarting PVE Daemon: pvedaemon.
Restarting PVE API Proxy Server: pveproxy.
successfully added node 'proxmox-02' to cluster

Et voilà, nos deux nœuds sont de nouveau joints dans le cluster ! \o/

Partager l'article :





fred

"Dire que l'on s'en fiche du droit à la vie privée sous prétexte qu'on a rien à cacher, c'est comme déclarer que l'on se fiche du droit à la liberté d'expression sous prétexte qu'on a rien à dire." Edward Snowden

4 commentaires

  1. Bonjour,
    Tout d’abord merci pour ton tutorial. ca a bien fonctionner. j’ai bien les 2 noeuds sur le proxmox1
    Une question, lors que l’on ajoute le second noeux au cluster, c’est logique que l’interface proxmox du 2ème serveur ne fonctionne plus du tout sur le port 8006 ?

  2. Bonjour Max,
    non ce n’est pas normal, normalement tu peux accéder à n’importe quel nœud sur le port 8006

  3. Bonjour merci pour l’article et votre blog. Pour ma part je cherche une commande pour supprimer un cluster, vous avez peut être une idée.

  4. «Et voilà, nos deux nœuds sont de nouveau joins dans le cluster ! \o/»

    joints

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.