Wgetを使用すると、ウェブサイト全体をダウンロードできません

Wgetを使用すると、ウェブサイト全体をダウンロードできません

ウェブサイト全体をダウンロードしたいのですが、終了したい場合は作業を再開できます。私の問題は、2番目のコマンドを実行したときに以前に作成したサブフォルダに移動しないことです。そのオプションも
試しましたが、同じエラーが発生したため、次のコマンドを使用しています。--mirror--no-clobber

wget --recursive -l inf --no-clobber --page-requisites --no-parent --domains xxx https://xxx/

特にこれは私が得た例です。

--2021-01-09 15:46:11--  https://domain/subfolder/
Reusing existing connection to domain:443.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
domain/subfolder: Is a directory

Cannot write to ‘domain/subfolder’ (Success).

2回目の実行では、コマンドは非常に高速に停止し、ディレクトリ内のファイルのすべてのスキャンをスキップしました。

前のタスクで作成したフォルダを確認するソリューションはありますかwget

ベストアンサー1

今日、私は問題が再帰または連続オプションではなく、301応答が返されたことを理解しました。最初はなぜそうしたのか、まだ理解していませんが、今ではすべてがうまくいきます。ジョブを停止して再開できます。各ファイルを確認した後、wgetは新しいコンテンツをダウンロードするか、古いダウンロードを続行します。いつものように、同じ問題がある方はこちらのリンクで https://lists.gnu.org/archive/html/bug-wget/2019-11/msg00036.html

誰かに役立つ場合は、今使用しているコマンドはwget -r --mirror -N -l inf --no-parent -R --trust-server-names --content-disposition --continue --です。ドメインサイトhttps://website

前の質問で見て読んだように、次のリダイレクトを許可するオプションは --trust-server-names です。次に、--content-dispositionを組み合わせると、すべてがうまく機能します。

みんなの助けをありがとう

おすすめ記事