見出し画像

「HTTrack」を使ってWebサイトを丸ごとバックアップしてみた 〜 M1 Mac編

2001年に作成された、とある団体のWebサイト。
今でも使われていることに驚きですが、
なんと
Wordで作成し、HTML出力
されたものが使われている!

そういえば当時はそういうのもありましたね…。

Webサイトの再構築を外部に依頼するほどの内容でもなく、自分たちでリニューアルすることになりました。
ほんとは予算も人員もない、ってとこなんですが。

自分のマシンがM1 Macなので、その記録も兼ねて記しておきます。


HTTrackのインストール

前提:
Homebrewがインストール済みであること

ターミナルで以下のコマンドを実行。
M1 Macは「arch -arm64」を先頭につけることを忘れずに。

$ arch -arm64 brew install httrack

下記のように表示されたら、完了。
マシンによって内容は少し異なるかもしれません。

Mac:~ (ユーザ名)$ arch -arm64 brew install httrack
==> Downloading https://formulae.brew.sh/api/formula.jws.json
######################################################################### 100.0%
==> Downloading https://formulae.brew.sh/api/cask.jws.json
######################################################################### 100.0%
==> Fetching dependencies for httrack: openssl@3
==> Fetching openssl@3
==> Downloading https://ghcr.io/v2/homebrew/core/openssl/3/manifests/3.1.1_1
######################################################################### 100.0%
==> Downloading https://ghcr.io/v2/homebrew/core/openssl/3/blobs/sha256:c4366444
######################################################################### 100.0%
==> Fetching httrack
==> Downloading https://ghcr.io/v2/homebrew/core/httrack/manifests/3.49.2_1-1
######################################################################### 100.0%
==> Downloading https://ghcr.io/v2/homebrew/core/httrack/blobs/sha256:82366a7496
######################################################################### 100.0%
==> Installing dependencies for httrack: openssl@3
==> Installing httrack dependency: openssl@3
==> Pouring openssl@3--3.1.1_1.arm64_ventura.bottle.tar.gz
🍺  /opt/homebrew/Cellar/openssl@3/3.1.1_1: 6,495 files, 28.4MB
==> Installing httrack
==> Pouring httrack--3.49.2_1.arm64_ventura.bottle.1.tar.gz
🍺  /opt/homebrew/Cellar/httrack/3.49.2_1: 233 files, 4.6MB
==> Running `brew cleanup httrack`...
Disable this behaviour by setting HOMEBREW_NO_INSTALL_CLEANUP.
Hide these hints with HOMEBREW_NO_ENV_HINTS (see `man brew`).
Mac:~ (ユーザ名)$ 

brewコマンドに慣れると、便利で楽ですね。

HTTrackを起動

ターミナルで以下のコマンドを実行。

$ httrack

HTTrackが起動し、いくつか入力を求めてくる。
順番に入力していきます。

Enter project name :にプロジェクト名を入力する。(例:test)

Welcome to HTTrack Website Copier (Offline Browser) 3.49-2
Copyright (C) 1998-2017 Xavier Roche and other contributors
To see the option list, enter a blank line or try httrack --help

Enter project name : test

Base path (return=/Users/(ユーザ名)/websites/) : は空白のままでOK。

Base path (return=/Users/(ユーザ名)/websites/) :

Enter URLs (separated by commas or blank spaces) : には保存したいWebサイトのURLを入力する。
(例:https://xxxx.com/)

Enter URLs (separated by commas or blank spaces) : https://xxx.com/

次にアクションを選ぶ。(例:1)

Action:
(enter)	1	Mirror Web Site(s)
	2	Mirror Web Site(s) with Wizard
	3	Just Get Files Indicated
	4	Mirror ALL links in URLs (Multiple Mirror)
	5	Test Links In URLs (Bookmark Test)
	0	Quit
: 1

以下の3箇所は、いずれも空白でOK。

Proxy (return=none) : 

You can define wildcards, like: -*.gif +www.*.com/*.zip -*img_*.zip
Wildcards (return=none) : 

You can define additional options, such as recurse level (-r<number>), separated by blank spaces
To see the option list, type help
Additional options (return=none) : 

Ready to launch the mirror? (Y/n) : には「y」と入力。半角です。

Ready to launch the mirror? (Y/n) : y

下記が表示され、サイトの保存が始まる。結構時間がかかる。
大したサイトでもないけど、30分はかかった。

Mirror launched on Thu, 13 Jul 2023 09:02:48 by HTTrack Website Copier/3.49-2 [XR&CO'2014]
mirroring (WebサイトのURL) with the wizard help..

下記が表示されたら、終了。

Done.
Thanks for using HTTrack!

保存されたサイトを確認する

サイトは「/Users/ユーザー名/websites/」の
指定したプロジェクト名(例:test)のフォルダに丸ごと保存されています。

最後に

コマンド「httrack」をたった一つ実行するだけで、ウェブサイトを丸ごと保存できます。
最近はクラウドベースで作成できる「ノーコードツール」を用いてWebサイトを作成される方も増えていると思います。
その際にも、こうやってBackupをとっておくことが必要になるときが来るかもしれませんね。
ただ、必要に差し迫られたときは時すでに遅し、ということもありますが。
定期的なBackupがあるといいですね。

この記事が気に入ったらサポートをしてみませんか?