WikiMiNET

La documentation technique et administrative

Outils pour utilisateurs

Outils du site


wiki:cluster:nas:upgrade_hulk

Ajout/remplacement de disques et cartes réseaux sur Hulk

Le Projet

Le NAS principal, Hulk, subit parfois des lenteurs. Le but de la mise à jour est d'installer 2 SSD afin qu'ils soient utilisés pour le caching et pour le logging (respectivement le L2ARC et le ZIL sur Solaris)

Le Déroulement

L'opération nécessite un arrêt du NAS, il faut donc:

  • Arrêter les VMs qui utilisent le NAS (en fait toutes les VM, cf avant dernier point).
  • (optionnel) Débrancher le téléphone de MiNET :P
  • Arrêter le NAS
  • Installer les SSD et les nouvelles cartes réseaux
  • Inclure les 2 SSD dans le pool zfs en tant que cache et log respectivement
  • Redémarrer le NAS
  • Redémarrer l'ensemble des machines physique sous Proxmox (plus propre car Proxmox utilise des scripts d'initialisations)
  • Checker que tout est bien reparti (on peut toujours rêver :P)

Problèmes rencontrés

pour utiliser le contrôleur SATA 3 il a fallu déplacer les disques qui étaient dessus sur le contrôleur SATA 2. Il a fallu aller dans le BIOS et configurer le contrôleur en mode AHCI.

Au redémarrage,ZFS n'a pas compris le remplacement des disques (en mode: Mais ils sont ou mes disques ?!?) et le pool en RaidZ n'était donc plus fonctionnel. Les deux commandes suivantes ont permis d'obtenir de nouveau un pool fonctionnel

  zpool export raidZ
  zpool import raidZ # en fait petite subtilité qu'on a manqué ici, cf l'import plus bas

Ensuite une fois l'état du pool redevenu normal, la mise en place des disques de cache et de log qui est ridiculement simple

  zpool add raidZ log c0t2d0
  zpool add raidZ cache c0t3d0

Il a ensuite fallu s'assurer que les partage NFS étaient correctement configurés, Les commandes suivantes permettent de voir les options de partages configurées { zfs get all raidZ zfs get sharenfs raidZ }} Il faut ensuite rétablir la connexion réseau vers le NAS. Il y a deux façon de faire:

  • En utilisant les commandes Solaris
  • En utilisant les commandes de la console Nexenta (nmc)

Pour restaurer une connexion basique et pouvoir travailler en ssh sur hulk uniquement les commandes Solaris ont été utilisées

  ifconfig ''interface'' 192.168.103.139/24
  ifconfig ''interface'' plumb
  ifconfig ''interface'' up

Pour l'aggrégation les commandes Nexenta ont été utilisées (désormais trois liens en aggrégation en native vlan 102)

  #pour démarrer la console nmc (nexenta management console)
  nmc
  #si ça ne marche pas, redémarrer le service avec la commande
  svcadm restart nmc
  #et enfin faire l'aggrégation en utilisant
  setup network aggregation

Il est important de passer par NMC ou la page web de nexenta plutôt que par les commandes unix ldadm et ifconfig car les modifications sont enregistrées au prochain démarrage. Aussi Nexenta possede des scripts plus complet de mise en place des interfaces. Pour plus d'info pour configurer le link-aggregation, notamment coté switch regarder ici Malgré les opérations, impossible de monter le share NFS depuis Proxmox, l'erreur a rapidement été identifiée, le pool raidZ ne se situe pas à la racine mais dans le dossier /volumes nous aurions donc du taper …

  zpool import -o /volumes/raidZ raidZ
  # et non
  zpool import raidZ

Quelques commentaires en vrac

  • Le redémarrage parfois long de Solaris surtout après une mise à jour, il faut juste être patient, en l'occurence Solaris c'est mis en mode failover suite à l'echec du montage du raidZ par conséquent la plupart des services dont SSH n'avaient pas bien démarrés, la commande suivante ne permettait donc pas de résoudre le problème
  svcadm enable SSH

L'astuce était qu'un service requit par SSH n'était lui même pas démarré, la commande suivante liste les raisons de l'échec Et permet ensuite de redémarrer le service concerné

  svcs -x ssh

La façon la plus simple est de redémarrer solaris en mode normal cette fois.

  • Le rpool, la pool ZFS qui ne contient qu'un disque qui est utilisé par le système d'exploitation ici affichait une erreur

même si il était resté sur le même contrôleur il avait pas trop aimé, un simple clear de l'erreur résolu le problème

  zpool clear rpool
  • On arrivait pas a trouver la façon correcte d'importer le zpool, les commandes zfs et zpool tapées sont toujours disponible,

il suffit de chercher comment on avait fait au moment de la mise en place grâce aux commandes suivantes

  zpool history
  zfs history
  • Nexenta possède deux commandes vous permettant de voir l'utilisation qui est faite du ZIL et Z2ARC
  • La commande zpool vous permet également de voir si les disques sont beaucoup utilisés
 zpool iostat
wiki/cluster/nas/upgrade_hulk.txt · Dernière modification: 2020/06/27 18:16 (modification externe)