Quelques conseils pour la sauvegarde de données

« Comment tu sauvegardes tes données ? »… Voilà une question à laquelle je dois régulièrement répondre aux moins geeks de mes proches. Voici quelques éléments de réponse.

Pourquoi sauvegarder ?

Ça peut paraître idiot dit comme ça. Mais c’est la première question à laquelle il faut savoir répondre pour mettre en place une stratégie de sauvegarde efficace. La sauvegarde répond en effet à plusieurs besoins, avec dans chaque cas une réponse légèrement différente. Voici quelques exemples d’utilisation des sauvegardes :

  • protéger ses données contre une panne matérielle,
  • protéger ses données contre les malwares,
  • protéger ses données contre les erreurs de manipulation,
  • archiver ses données,
  • protéger ses données contre la perte, le vol ou la destruction physique (catastrophe naturelle, incendie).

Que faut-il sauvegarder ?

C’est la deuxième question à se poser. Il n’est pas forcément nécessaire de sauvegarder l’ensemble de ses données à chaque fois. Et il peut même être préférable de ne pas le faire, pour rendre l’opération de sauvegarde plus rapide, et éviter ainsi qu’on finisse par ne plus la faire, par flemme ou par lassitude… Les données les plus importantes à sauvegarder sont celles qui sont irremplaçables : vos photos et vidéos personnelles, vos travaux, vos documents administratifs… Pour le reste, tout dépendra de votre motivation et des moyens que vous êtes prêts à consacrer à la sauvegarde. Il n’est par exemple pas forcément utile de perdre du temps et de l’argent à sauvegarder le dernier blockbuster tipiaké sur Internet : en cas de besoin, il sera presque toujours possible de le retrouver là où on l’avait pris…

Quand sauvegarder ?

La réponse à cette question découle de la précédente : la fréquence des sauvegardes dépend des données que vous souhaitez sauvegarder. Inutile par exemple de sauvegarder tous les jours vos archives de photo dont le contenu ne bouge jamais, si ce n’est par l’ajout de nouveaux clichés. Par contre, des données comme vos travaux en cours peuvent largement justifier une sauvegarde quotidienne, voir plus fréquente.

Comment sauvegarder ?

C’est la question à laquelle il est le plus dur de répondre. Et là encore, la réponse dépend des réponses précédentes. Il existe de nombreuses solutions de sauvegarde, travaillant sur de nombreux types de supports, chacun adapté à des types de données et des fréquences de sauvegarde différentes.

Du côté des supports, on peut notamment citer :

  • les supports optiques : bien adaptés à l’archivage de données rarement modifiés (photos, vidéos…), leur fonctionnement en lecture seule est également intéressant pour assurer l’accès aux sauvegardes sans risque d’effacement,
  • les disques durs : bien adaptés aux sauvegardes en continue de données fréquemment modifiés, ils sont également pratiques, rapides et économiques pour sauvegarder de gros volumes, ils sont par contre sujet au risque d’effacement accidentel et leur manipulation expose de gros volumes de données,
  • les bandes magnétiques : très lentes, elles sont surtout intéressantes pour l’archivage de gros volumes de données, mais le coût des lecteurs les réserve aux professionnels,
  • la sauvegarde en ligne (dans le « cloud » pour faire moderne) : elle a l’avantage de protéger efficacement contre la perte, le vol et les catastrophes naturelles, mais elle peut être coûteuse pour de gros volumes et nécessite une connexion Internet performante, surtout en cas de besoin urgent de restaurer… mieux vaut donc la compléter par d’autres moyens. La pérennité des sauvegardes peut également être problématique, donc mieux vaut éviter ces solutions pour l’archivage.
  • les supports flash : qu’il s’agisse de cartes mémoire, de SSD ou de clés USB, mieux vaut les éviter, ces supports n’étant pas du tout conçus pour ce genre d’usage.

Côté logiciel, plusieurs stratégies sont possibles :

  • la sauvegarde complète : système « bête et méchant », qui consiste à sauvegarder l’intégralité des données ciblées à chaque passe de sauvegarde. Cette solution est la moins performante et la plus coûteuse en espace de sauvegarde, mais à l’avantage de permettre une restauration complète à partir de n’importe quel jeu de sauvegarde. C’est une solution à privilégier pour des sauvegardes très espacées.
  • la sauvegarde différentielle : après une première sauvegarde, on ne sauvegarde que les fichiers modifiés depuis la sauvegarde complète. L’espace et le temps de sauvegarde sont fortement réduits, mais la restauration nécessite d’avoir deux jeux de sauvegarde (le plus récent et la sauvegarde complète initiale). Les jeux intermédiaires peuvent être supprimés pour libérer de l’espace et la sauvegarde peut être réinitialisée de temps en temps en refaisant une sauvegarde complète.
  • la sauvegarde incrémentale : après une première sauvegarde complète, on sauvegarde à chaque exécution les fichiers modifiés depuis l’exécution précédente. C’est la solution la moins gourmande en espace, mais la restauration nécessite de posséder tous les jeux de sauvegarde (augmentant donc le risque de ne pas pouvoir restaurer en cas de sauvegarde détériorée). La sauvegarde peut être réinitialisée de temps en temps en refaisant une sauvegarde complète. C’est une solution à privilégier pour des sauvegardes régulières.
  • la sauvegarde en continue : le principe est le même que celui de la sauvegarde incrémentale, mais avec une fréquence de mise à jour de la sauvegarde très élevée, quasiment en temps réel, ce qui la rend idéale pour la protection contre les erreurs de manipulation. Cette solution nécessite par contre que le support de sauvegarde soit accessible en permanence, ce qui le rend vulnérable aux attaques logicielles, et augmente son risque de panne.
  • la sauvegarde synchronisée : on part d’une sauvegarde complète puis, sur le même principe que la sauvegarde incrémentale, on sauvegarde à chaque exécution les modifications faites depuis la dernière exécution, mais en écrasant les fichiers de la sauvegarde précédente. Cette solution est la plus « compacte » (la taille totale de la sauvegarde est égale à la taille des données sauvegardées), est rapide à l’exécution et simple à restaurer (un seul jeu de sauvegarde à restaurer). Elle ne permet par contre pas de revenir en arrière sur une version antérieure à la dernière sauvegarde, ce qui la rend peu efficace contre les erreurs humaines et corruption de fichiers par des malwares : si la perte de données n’est pas détectée avant la synchronisation, les données deviennent irrécupérables… Il est donc important de ne faire ce type de sauvegarde que de façon manuelle et après avoir vérifié que les fichiers sont intacts.

La plupart des logiciels de sauvegarde proposent plusieurs modes de fonctionnement, avec un paramétrage de la fréquence des sauvegardes et de la durée de conservation des jeux de sauvegarde passés. Les paramètres devront être adaptés aux données à sauvegarder et aux événements dont on veut se protéger. Il est évident qu’une sauvegarde visant à se prémunir des erreurs humaines n’a pas les mêmes contraintes qu’une sauvegarde contre les incendies…

Par exemple, pour des archives de photos, une sauvegarde incrémentale hebdomadaire sans conservation des sauvegardes antérieures à la dernière sauvegarde complète fera très bien l’affaire, car on cherche avant tout à se protéger des pannes et des erreurs humaines, tandis que pour les travaux en cours, il sera préférable d’opter pour une sauvegarde continue, avec conservation de toutes les versions sur la dernière heure, d’une version par heure sur la dernière journée, une par jour sur la dernière semaine, etc… De quoi revenir facilement en arrière en cas d’erreur humaine, même si elle n’est détectée qu’après plusieurs jours.

N’oublions pas également de citer le cas du RAID, qui consiste à faire fonctionner plusieurs disques en parallèle. Ou plutôt si, oublions-le : contrairement à une idée reçue qui a la tête dure, le RAID n’est pas un moyen de sauvegarde, même si son principe est assez proche d’une sauvegarde synchronisée de fréquence infinie. Son but est simplement d’assurer la disponibilité des données en cas de panne matérielle, mais ne remplace pas une vraie sauvegarde, car il est totalement impuissant face aux autres causes de pertes de données.

À ce stade de la lecture, vous devez l’avoir compris : il n’y a pas de réponse universelle à cette question qu’on me pose si souvent. Chaque situation est spécifique, et si vous voulez gérer efficacement vos sauvegardes, il faudra réfléchir à ces quatre questions pour choisir la meilleure solution.

Voici un cas pratique qui pourra vous aider, et au passage vous présenter quelques logiciels. Revenons donc à la question initiale de cet article…

Comment je sauvegarde mes données ?

De mon côté, j’ai opté pour une stratégie plutôt diversifiée (et ne respectant pas forcément tous les conseils données plus haut…).

Au début, je ne faisais que de la sauvegarde manuelle, sur DVD-R pour les données statiques (photos, vidéos, musique, documents administratifs, etc…) et sur DVD-RW pour ce qui bouge plus souvent (travaux en cours).

Mais ce genre de sauvegarde étant trop fastidieuse, j’ai fini par opter pour de la sauvegarde incrémentale quasi automatisée, en sauvegardant sur deux disques externes de 1 To, utilisés en alternance (la seule étape non automatisée étant la connexion du disque au moment de faire la sauvegarde). Pour ça, j’utilisais (et utilise encore) Genie Backup Manager (en). L’une des raisons qui m’a fait choisir ce logiciel est son format d’archive : les fichiers GBP sont des fichiers ZIP chiffrés en AES parfaitement standards, ce qui permet d’en extraire des fichiers sans nécessairement passer par Genie Backup. Bien pratique pour une restauration « à l’arrache ».

Dans le logiciel, j’ai défini quatre tâches de sauvegarde, toutes incrémentales, exécutées une fois par semaine :

  • Vidéos : un backup complet tous les 52 incréments, sans conservation du backup précédent,
  • Musique : un backup complet tous les 26 incréments, avec conservation du backup précédent,
  • Photos : un backup complet tous les 13 incréments, avec conservation des 4 backups précédents,
  • Autres documents (travaux en cours, administratif…) : un backup complet tous les 4 incréments, avec conservation des 13 backups précédents.

Je continuais en plus à faire occasionnellement des sauvegardes sur DVD, surtout pour les photos et vidéos, et, de temps en temps, je faisais en plus une sauvegarde distante vers mon serveur OVH, mais j’ai vite abandonné (comme je le disais en introduction, évitez les méthodes de sauvegarde trop contraignante, pour ne pas abandonner…) et me suis mis en quête d’une solution automatisée. Je l’ai finalement bricolé moi-même avec BoxCryptor (en) et Synkron (en) pour envoyer automatiquement mes fichiers vers Google Drive, Dropbox et Sky Drive à intervalles réguliers, et en prime pouvoir également y accéder facilement quand je ne suis pas chez moi. J’avais à l’époque détaillé cette solution sur mon ancien blog. Vu les capacités de stockage, je me suis contenté de faire ça pour les « autres documents » et les photos. La musique bénéficie déjà d’autres « sauvegardes » distantes, dans mes comptes iTunes et Amazon MP3 et l’importance de mes vidéos persos ne justifiait pas de payer des extensions de capacité de stockage (je filme relativement peu, et je tiens surtout aux photos, pas aux vidéos). Mes photos sont également synchronisées avec Google+ sans chiffrement supplémentaire, mais en définition réduite (2048×2048), ce qui me permet de les consulter directement en ligne et me fait une sauvegarde de la dernière chance.

Enfin, plus récemment, j’ai fini par opter, en complément des solutions déjà en place, pour un système de sauvegarde en continue, avec CrashPlan (en). Je l’avais installé juste pour essayer, et je l’ai finalement vite adopté. En effet, outre la sauvegarde en continu sur un disque dédié, disponible gratuitement, CrashPlan propose un service de sauvegarde en ligne très compétitif, à partir de 3$ par mois pour un espace de stockage illimité. Je dispose ainsi d’un jeu de sauvegarde complet en local, facile d’accès, et d’un second jeu en ligne en cas de très gros problème chez moi, avec en prime un bel historique de version. Attention quand même à un point si vous optez pour ce service : par défaut, CrashPlan a accès à votre clé de chiffrement, il faut activer l’option « Protéger la clé avec un mot de passe privé » pour la sécuriser.

Voilà, c’est tout pour aujourd’hui. Félicitations si vous avez tenu jusqu’au bout de cet article 🙂

J’espère qu’il vous sera utile pour définir votre stratégie de sauvegarde. Si vous avez des questions, n’hésitez pas à les poser en commentaire. Vous pouvez également me contacter pour une étude personnalisée sur une stratégie de sauvegarde adaptée à vos besoins.

4 réflexions sur « Quelques conseils pour la sauvegarde de données »

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.