URLからWebページとリンクされたコンテンツを再帰的にダウンロードする方法は?

URLからWebページとリンクされたコンテンツを再帰的にダウンロードする方法は?

再帰を使用してWebページをダウンロードしたいですwget。再帰的ということは、それが指すことができる他のすべてのファイルもダウンロードする必要があるということです。その理由は、その内容をオフラインでも合理的に見ることができることを望むからだ。

ダウンロードする必要があるWebページが同じWebサイトの別のページにリンクされていますが、そのページもダウンロードできれば幸いです。

これは可能ですかwget?どんな兆候がありますか?

ベストアンサー1

努力する:

wget -r -np -k -p http://www.site.com/dir/page.html

パラメータ(参照man wget)は次のとおりです。

  • rリンクに再帰してこれらのページも検索します(デフォルトの最大深度は5です。を使用して設定できます-l)。
  • np絶対親ディレクトリを入力しないでください。つまり、「ホーム」リンクをクリックせずにサイト全体をミラーリングします。これにより、ccc上記の例では上記の内容が防止されます。
  • kローカルコピーに基づいてリンクを変換します。
  • pスタイルシートなどのページ前提条件を取得します(npルールの例外です)。

私が正確に覚えているなら、wgetはドメイン名のディレクトリを作成し、その中にすべてを入れます。しかし、もし備えて空のPWDで試してみてください。

おすすめ記事