Xencenter : pool et maintenance Mode

Je viens de me faire une petite frayeur avec un de nos pools xenserver : tous les serveurs étaient en « maintenance mode » et aucun ne voulaient en sortir.

Du coup, impossible d’accéder aux consoles et les VM du master refusaient de démarrer … seul point positif, les VMs des autres serveurs du pools restaient disponibles et heureusement, car ce sont nos serveurs citrix, qui accueillent donc les utilisateurs …

Les heures passant, je m’arrachais presque les cheveux pour savoir comment j’allais me sortir de ce mauvais pas ? C’est ce que nous allons voir ici … 

Tout d’abord, il faut savoir comment j’en suis arrivé là : en faisant simplement un export d’une VM !!! Malheureusement, j’ai lancé la commande depuis le répertoire home du root, et pas depuis l’espace partagé, ce qui au bout d’un moment a planté.

J’ai donc voulu arrêter l’opération, mais impossible, rien ne marchait, et au bout du compte j’ai du me résoudre à rebooter au bouton le master du pool … Quand il a redémarré et que j’ai pu accéder au pool, toutes les machines du pool étaient dans le mode maintenance (reconnaissable à son petit logo bleu exécrable),même le master.

Un clic droit sur ce dernier a permis de l’en sortir, mais les autres serveurs ont catégoriquement refusés l’opération (elle tournait indéfiniment, comme je le constatait dans l’onglet log). De plus, j’avais arrêté mes VMs sur le master, et celles ci refusaient de démarrer.

Apres moult recherches, j’ai appliqué la recette suivante :

  • Je me suis connecté sur un des serveurs (on va le nommer 202) via putty en ssh.
  • Je l’ai promu master : « xe pool-emergency-transition-to-master »
  • J’ai modifié sa configuration : « vi /etc/xensource/pool.conf » l’unique ligne doit contenir « master »
  • J’ai relancé le service xapi : « service xapi restart »

Puis sur chacun des autres serveurs, dont l’ancien master :

  • Je me suis connecté sur le serveur via putty en ssh.
  • J’ai modifié sa configuration : « vi /etc/xensource/pool.conf » l’unique ligne doit contenir « slave:adresseip du 202 »
  • J’ai relancé le service xapi : « service xapi restart »

Et là, miracle, dans ma console xencenter, tout est revenu à la normale … Du coup, je vais laisser le 202 être Master toute la nuit, je rechangerais la configuration demain ^_^

J’en profite pour donner les liens qui m’ont permis de m’en sortir :

J’expère que cela pourra être utile à d’autres, au pire ça me servira de pense-bête quand ce même probleme se reproduira ^_^

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *