ダウンロードしたファイルがファイル名の最初の文字を含むサブフォルダに分割されるように、非常に大きなURLリストをダウンロードするにはどうすればよいですか？

Question

たぶん、次のようなものがあります。

awk -F/ '{print substr($NF, 1, 1), $0}' urls.txt |
  xargs -L1 bash -c 'mkdir -p -- "$0" && curl -sSF -O --output-dir "$0" "$1"'

各行の前にawkファイル名の最初の文字を追加し、その文字を使用してcurlコマンドから出力ディレクトリを選択します。-PGNU実装オプションを使用して、複数のxargs抽出を並列に実行できます。

URLには空白、引用符、またはバックスラッシュが含まれていないと見なされますが、URLにはURIエンコーディング以外のものを含めないでください（curl直接処理してURIエンコーディングを実行できます）。

例の入力が与えられたら、上記のコマンドを実行すると次のようになります。

.
├── 0
│   └── 0wd.pdf
├── a
│   ├── asz.pdf
│   └── axz.pdf
└── b
    ├── b00.pdf
    └── bb0.pdf

Answer 1

たぶん、次のようなものがあります。

awk -F/ '{print substr($NF, 1, 1), $0}' urls.txt |
  xargs -L1 bash -c 'mkdir -p -- "$0" && curl -sSF -O --output-dir "$0" "$1"'

各行の前にawkファイル名の最初の文字を追加し、その文字を使用してcurlコマンドから出力ディレクトリを選択します。-PGNU実装オプションを使用して、複数のxargs抽出を並列に実行できます。

URLには空白、引用符、またはバックスラッシュが含まれていないと見なされますが、URLにはURIエンコーディング以外のものを含めないでください（curl直接処理してURIエンコーディングを実行できます）。

例の入力が与えられたら、上記のコマンドを実行すると次のようになります。

.
├── 0
│   └── 0wd.pdf
├── a
│   ├── asz.pdf
│   └── axz.pdf
└── b
    ├── b00.pdf
    └── bb0.pdf

おすすめ記事