wgetミラーサイト+他のドメインのリソース

wgetミラーサイト+他のドメインのリソース

オフラインで閲覧できるようにWebサイトをダウンロードしようとしていますが、html、画像、css、javascriptなどが必要です。

問題は、すべての画像がWebサイトと同じドメインでホストされておらず、CSSとJavaScriptもホストされていないことです。一部の画像はimgurからインポートされ、他の画像は他のファイル共有サイトからインポートされます。つまり、このサイトで使用されるリソースを保持するドメインがたくさんあります。

単一のドメインからhtmlをダウンロードしながら、そのhtmlが使用するリソースをすべてのドメインから取得するにはどうすればよいですか?

ベストアンサー1

パラメータセットを使用する必要があります。ホストスパニング:

主に:

  • -H指定されたホスト以外のホストに移動
  • -D含めるドメインの指定
  • --exclude-domains除外するドメインの指定

たとえば、

wget -rH --exclude-domains flickr.com myownsite.com

おすすめ記事