====== Backup mortes ====== Des backups mortes ? Késako ? ===== Le principe ===== Il y a des consensus sur ce que devrait respecter une infrastructure de stockage résiliente, notamment on retrouve la [[https://blog.genma.fr/?Sauvegarde-la-regle-des-3-2-1|règle des 3-2-1]]. Voir aussi ce très bon article sur les backups : [[https://blog.lrdf.fr/article9/mettre-en-place-une-strategie-de-sauvegarde|https://blog.lrdf.fr/article9/mettre-en-place-une-strategie-de-sauvegarde]] Bon nous avons donc 3 réplicas de nos données, avec des sauvegardes mais stockés sur les mêmes serveurs. Dans les grandes organisations, usuellement des sauvegardes sont faites sur [[https://fr.wikipedia.org/wiki/Bande_magn%C3%A9tique|bandes magnétiques]] et stockés en offline dans un coffre ignifugé, soit dans le site, ou mieux hors site (ce qui est le cas de la DISI). L'idée c'est de pouvoir récupérer les données en cas de problème, typiquement dans notre cas, si on perd les sauvegardes, il n'y a pas moyen de les récupérer. On peut perdre nos sauvegardes dans plusieurs situations : quelqu'un supprime nos sauvegardes (de façon accidentelle ou non), un problème logiciel nous fait perdre nos sauvegardes (on dépend de Ceph). L'idée est donc que régulièrement des sauvegardes sont faites et stockés sur un support de préférence différent que le support initial, et qui ne sont pas en ligne. ===== Quelques idées ===== Vous l'aurez compris, il est bon d'utiliser une autre technologie que celle utilisée pour le stockage initial. Bien sûr vous pouvez acheter un serveur qui écrit et lit sur bande magnétique ([[https://www.amazon.com/POWERVAULT-Dell-LTO-2-drives-enclosure/dp/B0153ILI2M/ref=sr_1_16?ie=UTF8&qid=1529351500&sr=8-16&keywords=powervault+lto|powerVault]] et des [[https://www.amazon.com/dp/B003IIVVRC/ref=sxbs_sxwds-stppvp_3?pf_rd_m=ATVPDKIKX0DER&pf_rd_p=6297546923292665688&pd_rd_wg=6CCNC&pf_rd_r=J7ZHV4P621AV61CG5RHJ&pf_rd_s=desktop-sx-bottom-slot&pf_rd_t=301&pd_rd_i=B003IIVVRC&pd_rd_w=LS0nd&pf_rd_i=magnetic+tape+storage&pd_rd_r=0b087bac-29f7-40de-ac4c-2899ca4a3fc9&ie=UTF8&qid=1529351379&sr=3|cassettes]]), pour environ 1700€ (ce sont les cassettes qui coûtent le plus cher) vous pouvez avoir ce genre d'équipement, après reste à déterminer le lieu de stockage. L'idée qui suit est plutôt pour expérimenter qu'autre chose Sinon comme idée sympa, avec Ceph vous pouvez récupérer une image du disque/snaphsot et on peut même y rajouter dans le cas d'une image toutes les snapshots associées. Vous pouvez aussi exporter les différences entre deux snapshots, et dresser la liste des sections du disques qui ont changées entre deux états de l'image disque. Donc il devrait être possible d'exploiter toutes ces fonctionnalités pour exporter les données de façons optimale (envoyer le moins possible) vers un fichier sur un dataset ZFS. Si vous êtes vraiment chaud, après ça vous devriez être capable de redonder le stockage en ajoutant du ZFS avec NFS ou iSCSI, comme ça si ceph tombe à cause d'un problème logiciel (bug, etc) on a encore du ZFS avec un export qui fonctionne. Sinon en terme de backup vous pouvez aussi regarder ce que fait OVH : [[https://archive.fosdem.org/2018/schedule/event/backup_ceph_at_scale/|présentation backup OVH]]