ダウンロード方法を尋ねる
- すべて(.svg)画像
- Wikipediaの記事で
各画像に対して手動でこれを行う必要はありません。 Wikipediaはより複雑なURLスキームを使用して、さまざまな解像度とさまざまな形式の画像を提供します。
例URL:
https://en.wikipedia.org/wiki/Thirty-six_Views_of_Mount_Fuji
ベストアンサー1
完璧な解決策を見つけました。douji.io~のWget、Grep、Sedを使用してWebからパブリックドメインの壁紙をダウンロードします。。私はそれを主なステップにまとめようとしました(ここでも使用できるように):
HTMLページをダウンロードするには、次のコマンドを使用します
wget
。wget https://en.wikipedia.org/wiki/Thirty-six_Views_of_Mount_Fuji \ -O page.html -O page.html
grep
画像URLを使用して抽出しますsed
。次に、記事からURLを抽出して新しいファイルに書き込みます。 URL.txt:grep -E "(https?:)?//[^/\s]+/\S+\.(jpg|png|gif|svg)" page.html -o | sed "s/(^https?)?\/\//https\:\/\//g" -r > urls.txt
次のコマンドを使用して画像をダウンロードします
wget
。親指画像
サムイメージのみが必要な場合は、以下を使用して実行できます。wget -i urls.txt -P downloads/
フルサイズ画像
フルサイズの画像を取得するにはURLファイル(URL.txt)新しいファイル(urls-new.txt):sed -E "s/\/thumb//g; s/\/[0-9]+px-.+\.(jpg|png)$//g" urls.txt | uniq > urls-new.txt
その後、ダウンロードを再開します。
wget -i urls-new.txt -P downloads_full_size/
リンクされた記事のフルクレジット。