wgetと再帰的なwgetからファイルをダウンロードしない

wgetと再帰的なwgetからファイルをダウンロードしない

同様のコマンドを使用できますが、wget -m -A.jpg http://www.mysite.tld/すべてのファイルをダウンロードしてからjpgでない場合は、次のようにファイルを削除します。

`HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘index.html’

index.html                             [           <=>                                                     ]   1.73K  --.-KB/s   in 9.5s   

2015-01-13 16:55:52 (186 B/s) - ‘index.html’ saved [1776]

Removing index.html since it should be rejected.`

ウェブサイトから他のファイルをすべてダウンロードし、後で削除する必要なしに.jpgファイルのみをダウンロードしたいと思います。ファイルの一部は非常に大きく、残りは非常に大きいためです。

ベストアンサー1

これはwgetによって解析されたリンクツリーの一部です。これはhtm / htmlに対してのみ行われます(つまり、jpg以外のすべてのファイルをダウンロードするのではなく、.htmまたは.htmlファイルであるすべてのjpg以外のファイルのみをダウンロードします)。それは機能の一部でなければなりません。望むより、https://www.gnu.org/software/wget/manual/html_node/Types-of-Files.html

注:接続してコマンドを実行してファイルを一覧表示し、出力をテキストファイルにリダイレクトできる場合は、wgetにリンク経由でダウンロードさせる代わりに、ファイルからダウンロードURLを読み取ることができますmysite.tldwget -i foo.txt

例:リモートシステムから:その後、ls *.jp* > foo.txtローカルシステムから:(もちろん、ローカルシステムに移動するか、別の方法でポイントするwget -i -F foo.txt -B http://www.mysite.tld/foo.jpg必要があります)foo.txt

おすすめ記事