Pendant une nouvelle installation de Proxmox, je fus confronté à un problème de communication pendant la mise en place d’un cluster entre deux nœuds Proxmox.
Problème Waiting for quorum… Timed-out waiting for cluster
Le message d’erreur en question :
Starting cluster: Checking if cluster has been disabled at boot... [ OK ] Checking Network Manager... [ OK ] Global setup... [ OK ] Loading kernel modules... [ OK ] Mounting configfs... [ OK ] Starting cman... [ OK ] Waiting for quorum... Timed-out waiting for cluster [FAILED] waiting for quorum...
Dans le cas présent, les deux nœuds ne sont pas configurer en Haute Disponibilité, juste en mode cluster pour administrer dans une seule interface web les deux nœuds. Donc, dans cette configuration je n’ai pas besoin d’un Quorum. Cependant, il y a bien un problème de communication ou de configuration sur un des deux nœuds.
Vérification de la configuration des deux nœuds Proxmox
Les premiers fichiers à vérifier sur les deux noeuds sont /etc/hosts et /etc/hostname. Pour optimiser la communication réseau entre les deux noeuds, il est possible d’ajouter le nom et l’adresse IP entre les deux nœuds, comme suit :
- Sur le nœud 1 :
127.0.0.1 localhost.localdomain localhost 10.10.10.4 proxmox-01.domaine.tld proxmox-01 pvelocalhost 10.10.10.5 proxmox-02.domaine.tld proxmox-02
et vérifier son hostname :
hostname proxmox-01
- Sur le nœud 2 :
127.0.0.1 localhost.localdomain localhost 10.10.10.5 proxmox-02.domaine.tld proxmox-02 pvelocalhost 10.10.10.4 proxmox-01.domaine.tld proxmox-01
et vérifier son hostname :
hostname proxmox-02
Dans mon cas, j’avais écris un mauvais nom dans le fichier /etc/hosts.
Supprimer un nœud
Si on essaie de supprimer le nœud directement, on peut avoir ce message d’erreur :
pvecm delnode proxmox-01 cluster not ready - no quorum?
Voici la méthode pour supprimer un nœud Proxmox, à faire sur le nœud 2 :
pvecm expected 1 pvecm delnode proxmox-01
Personnellement, j’ai réitéré les commandes sur l’autre nœud, histoire de me retrouver dans la situation de départ.
Ajouter de nouveau un nœud au cluster
Si on exécute de suite la commande pvecm add, on peut avoir ce message d’erreur :
pvecm add proxmox-01 authentication key already exists
En fouillant das le man, c’est indiqué qu’il faut ajouter l’option -force :
pvecm add proxmox-01 -force The authenticity of host 'proxmox-01 (10.10.10.4)' can't be established. ECDSA key fingerprint is 66:c6:b7:01:e2:dd:89:e7:37:6a:26:45:9d:d9:77:ad. Are you sure you want to continue connecting (yes/no)?
On répond yes :
copy corosync auth key stopping pve-cluster service Stopping pve cluster filesystem: pve-cluster. backup old database Starting pve cluster filesystem : pve-cluster. Starting cluster: Checking if cluster has been disabled at boot... [ OK ] Checking Network Manager... [ OK ] Global setup... [ OK ] Loading kernel modules... [ OK ] Mounting configfs... [ OK ] Starting cman... [ OK ] Waiting for quorum... [ OK ] Starting fenced... [ OK ] Starting dlm_controld... [ OK ] Tuning DLM kernel config... [ OK ] Unfencing self... [ OK ] generating node certificates merge known_hosts file restart services Restarting PVE Daemon: pvedaemon. Restarting PVE API Proxy Server: pveproxy. successfully added node 'proxmox-02' to cluster
Et voilà, nos deux nœuds sont de nouveau joints dans le cluster ! \o/
Bonjour,
Tout d’abord merci pour ton tutorial. ca a bien fonctionner. j’ai bien les 2 noeuds sur le proxmox1
Une question, lors que l’on ajoute le second noeux au cluster, c’est logique que l’interface proxmox du 2ème serveur ne fonctionne plus du tout sur le port 8006 ?
Bonjour Max,
non ce n’est pas normal, normalement tu peux accéder à n’importe quel nœud sur le port 8006
Bonjour merci pour l’article et votre blog. Pour ma part je cherche une commande pour supprimer un cluster, vous avez peut être une idée.
«Et voilà, nos deux nœuds sont de nouveau joins dans le cluster ! \o/»
joints