Copie statique d'un site web

wget permet de créer simplement une copie statique complète d’un site web :

$ wget -q --mirror -p --adjust-extension -e robots=off --convert-links --base=./ -P ./ <UrlSiteWeb>

Les options utilisées ici sont les suivantes :

  • -q : pas d’affichage
  • --mirror : active les options nécessaire à une copie complète
  • -p : téléchargement de tous les fichiers nécessaires à l’affichage d’une page HTML
  • --adjust-extension : ajout de html en fin de chaque fichier de page web téléchargé, si cette extension n’est pas déjà présente
  • -e robots=off : ignore les demandes du site faites aux robots d’indexer des pages
  • --convert-links : après téléchargement, conversion des liens de façon à obtenir des pages affichables localement
  • --base : URL de base pour les liens relatifs
  • -P : répertoire où tous les fichiers vont être écrits

C’est cette commande que j’ai utilisée pour créer la copie statique de l’ancienne version de monblocnotes.