Statische Kopien Ihrer Website mit dem httrack Website Copier und cron job anlegen

Mit httrack, wenigen Zeilen Skript und einem Cronjob können Sie eine sich sich immer wieder selbst aktualisierende, statische Kopie Ihrer Website (beispielsweise WordPress) anlegen. Diese Kopie können Sie dann als Backup verwenden, sollte es jemals Probleme mit ihrer eigentlichen Website geben. Sogar eine voll- oder teilautoamatische Umschaltung auf die Backup-Variante Ihrer Website ist möglich. Lediglich dynamische Elemente wie Formulare und Ajax Calls etc. werden nicht funktionieren. Dennoch ist das Ganze ggf. ein guter Weg, um Downtimes zu vermeiden und bei Ausfällen Ihrer WordPress-Installation oder Ihres anderweitigen CMS wenigstens eine Grundversion der Website zu präsentieren. Und das ohne die Kosten, die andere Lösungen, die in Richtung Hochverfügbarkeit gehen, verursachen würden.

Ein bewährter Weg zum Anlegen der statischen Kopie ist httrack: Dabei handelt es sich um ein Open Source Tool, mit dem sich Websites herunterladen lassen. httrack existiert mit GUI für Windows, aber auch als Kommandozeilen Version.

Mithilfe von httrack können Sie (nach Installation von httrack auf einem Server, Code unten getestet mit Plesk Onyx,  Ubuntu 18) in etwa folgenden Weg gehen:

  1. Ggf. zu Beginn die alte statische Version Ihrer Website löschen:
    rm -rf /var/www/vhosts/ihrewebsite.tld/httpdocs/static \;

  2. Die komplette Website herunterladen und im Pfad static abspeichern, dabei nichts herunterladen, was außerhalb von www.ihrewebsite.tld liegt:
    httrack https://www.ihrewebsite.tld// -O "/var/www/vhosts/ihrewebsite.tld/httpdocs/static" +www.ihrewebsite.tld/* -%v -s0 \;

  3. Das hinzugefügte "index.html" aus Links löschen, sofern Sie die Kopie nicht lokal auf Ihrem Rechner anschauen, sondern von einem Webserver abrufbar machen wollen:
    find . -name '*.html' -exec sed -i 's%index.html%%g' {} \;

Diese drei Befehle fassen Sie in einer Datei zusammen, nennen sie beispielsweise httrack.sh und machen sie ausführbar. Dann setzen Sie darauf einen Cronjob an, der die Datei beispielsweise einmal täglich ausführt.

Anleitung ohne Gewähr - wir helfen gern. Wichtig: httrack ist ein Tool, das beim Einsatz auf einem Server nicht für Anfänger geeignet ist, denn bei geringfügigen Syntaxfehlern laufen Sie Gefahr, dass Ihr Skript versucht, das gesamte Web herunterzuladen. Das zwingt jeden Server eher früher als später in die Knie. Also: Aufpassen, nur auf Testsystemen experimentieren und auf eigene Verantwortung handeln.

 

 

  • Websites, WordPress, Backup
  • 1 Benutzer fanden dies hilfreich
War diese Antwort hilfreich?

Verwandte Artikel

Gelöst: FTP-Verbindungen mit FileZilla & Co. zu Plesk Server nicht möglich

Sie nutzen einen E-Mail Client wie FileZilla. FTP-Verbindungen zum Server werden zwar aufgebaut,...

So erhalten Sie Ihr WordPress Backup (nur für unsere Kunden)

Anleitung nur unsere eigenen Kunden:  Sie haben ein Backup oder einen Export Ihrer WordPress...

Plesk / Apache: Let's-Encrypt-Zertifikat trotz 301-Umleitung erneuern

Sie haben eine Domain mit einer 301-Umleitung auf eine andere Domain umgeleitet. Die umgeleitete...

Gelöst: Plesk mit nginx Proxy: Let's Encrypt Zertifikat kann nicht erneuert werden, Fehler 403

Setup: Website auf einem Plesk Server mit nginx Proxy, Let's Encrypt Zertifikat mit automatischer...