ホームページをまるごとダウンロードするには wget

気になるホームページを画像やリンク先も含めて、まるごとダウンロードしたいときがあります。そんなときは wget というGNUのツールがあります。Vine Linux には標準でインストールされています。詳しい使い方は wget --help または、info wget で調べることができます。しかし、ホームページのダウンロードだけなら次のように入力するのを憶えておけば十分です。

$ wget -rLl 10 URL

コマンドラインオプションの意味は -r: 再帰的に取得する(取り扱い注意!)、-L: 相対リンクのみをたどる、-l: 再帰の深さを指定(0 は無限)、です。

例えばこのホームページをダウンロードしたい場合(そういう奇特な方がおられるかどうかは分かりませんが)、次のようにコンソールから入力します。

$ wget -rLl 10 http://www.mnet.ne.jp/~tnomura/

ダウンロード中にたくさんのメッセージが出てきて楽しいですが、最期に「終了」メッセージが出て終ります。そこで、ls でカレントディレクトリーのファイルリストを表示させると、www.mnet.ne.jp といディレクトリーが作成されています。このホームページの場合、ファイル群は www.mnet.ne.jp/%7Etnomura/ 以下にダウンロードされています。そこで、

w3m www.mnet.ne.jp/%7Etnomura/index.html

で確認してみてください。(2000/05/06更新)

注意:ディレクトリー名に'%7E'があると、netscapeでは表示できません。mv %7Etnomura tmomura として、ディレクトリー名を変更してみてください。

注意2:新しいバージョンの wget では上の操作は wget -r URL となります。 明示的に再帰の深さを指定していないときのはデフォルトは 5 です。使い方が 大部古い版とはことなっているので man wget で確認してください。