BLog

ImprintImpressum
PrivacyDatenschutz
DisclaimerHaftung
Downloads 

Eine Web-Präsenz vollständig herunterladen

Um eine Web-Präsenz in Gänze herunterzuladen, wird ein Tool benötigt, das alle verknüpften Dateien aufruft, indem es rekursiv den Links auf weitere Seiten sowie auf eingebundene Inhalte wie Bild-, JavaScript- und CSS-Dateien folgt. Damit nicht das gesamte Internet geladen wird, sollen allerdings die Datei-Aufrufe auf die angegebene Domain beschränkt bleiben.

Ein geeignetes Tool für diesen Zweck ist wget(1). Um beispielsweise diesen BLog komplett in ein Verzeichnis auf unseren FreeBSD-Server zu laden, macht man folgendes:

  1. Installation des CA-Root-Zertifikate-Packets des Mozilla Projekts:
    pkg install ca_root_nss
  2. Installation von ftp/wget:
    pkg install wget
  3. Herunterladen des kompletten BLogs:
    wget -r -l inf -nH -np -nv -N -e robots=off --ca-certificate=/etc/ssl/cert.pem \
    -P "obsigna.com" "https://obsigna.com/"

Mein kompletter BLog befindet sich nun im lokalen Verzeichnis obsigna.com. Man muß sich allerdings damit abfinden, daß Web-Browser aus Sicherheitsgründen keine lokalen Dateien in <iframe>-Tags nachladen. D.h. das Inhaltsverzeichnis in der rechten Spalte fehlt, wenn ein Browser den BLog direkt vom Dateisystem heraus lädt.

Copyright © Dr. Rolf Jansen - 2018-07-19 16:06:56

PROMOTION