Un petit mémo sur comment configurer le watchdog matériel via ipmi sur des serveurs sous Proxmox en cluster haute disponibilté.
Configuratuion de l’iDrac
Configuration du watchdog matériel
- Activer le watchdog matériel :
- Décommenter la ligne WATCHDOG_MODULE=ipmi_watchdog dans le fichier
/etc/default/pve-ha-manager
(à faire sur l’ensemble des noeuds du cluster) :
sed -i '2 s/#//' /etc/default/pve-ha-manager
- Décommenter la ligne WATCHDOG_MODULE=ipmi_watchdog dans le fichier
- Editer le fichier
/etc/default/grub
et modifier la ligne GRUB_CMDLINE_LINUX_DEFAULT :sed -i '/^GRUB_CMDLINE_LINUX_DEFAULT=/s/"quiet"/"quiet nmi_watchdog=0"/' /etc/default/grub
- action : comportement du serveur lors d’un problème
- panic_wdt_timeou : choix de la durée en seconde avant action lors d’un problème
- Mettre à jour le GRUB :
update-grub
echo "options ipmi_watchdog action=power_cycle panic_wdt_timeout=10" > /etc/modprobe.d/ipmi_watchdog.conf
impi_watchdog
:- Charger le module :
modprobe ipmi_watchdog
reboot
ipmitool mc watchdog get