jueves, 20 de mayo de 2010

Cluster XEN - bloqueo Filesystem compartido

Después de configurar un cluster de Xen con openais, ocfs2, con los recursos dlm, o2cb y filesystem en el cluster, probando el failover en la caída de uno de los nodos (reboot desde ILO) me he encontrado que el punto de montaje compartido se quedaba totalmente bloqueado hasta que no se volvía a levantar el nodo que había "tirado".

En el log veía algo como: do_sysfs: write "0" to "/sys/kernel/dlm/4E0AD0290F4A43BCAC24CF8314B01A7A/control"

La solución es tan simple como complicada de encontrar por internet, simplemente es necesario crear los recursos de STONITH y tenerlo activado.

Una vez STONITH está activo, he hecho la prueba (varias veces) de tirar un nodo desde la ILO y el bloqueo es solo de unos segundos e inmediatamente una vez recuperado, se levantan las máquinas virtuales en el otro nodo.

No hay comentarios:

Publicar un comentario