単一のWikipediaの記事からフル解像度(svgなど)のすべての画像をダウンロードする方法[重複]

単一のWikipediaの記事からフル解像度(svgなど)のすべての画像をダウンロードする方法[重複]

ダウンロード方法を尋ねる

  • すべて(.svg)画像
  • Wikipediaの記事で

各画像に対して手動でこれを行う必要はありません。 Wikipediaはより複雑なURLスキームを使用して、さまざまな解像度とさまざまな形式の画像を提供します。

例URL:

https://en.wikipedia.org/wiki/Thirty-six_Views_of_Mount_Fuji

ベストアンサー1

完璧な解決策を見つけました。douji.io~のWget、Grep、Sedを使用してWebからパブリックドメインの壁紙をダウンロードします。。私はそれを主なステップにまとめようとしました(ここでも使用できるように):

  1. HTMLページをダウンロードするには、次のコマンドを使用しますwget

    wget https://en.wikipedia.org/wiki/Thirty-six_Views_of_Mount_Fuji \
         -O page.html -O page.html
    
  2. grep画像URLを使用して抽出しますsed。次に、記事からURLを抽出して新しいファイルに書き込みます。 URL.txt:

    grep -E "(https?:)?//[^/\s]+/\S+\.(jpg|png|gif|svg)" page.html -o | 
    sed "s/(^https?)?\/\//https\:\/\//g" -r > urls.txt
    
  3. 次のコマンドを使用して画像をダウンロードしますwget

    • 親指画像
      サムイメージのみが必要な場合は、以下を使用して実行できます。

      wget -i urls.txt -P downloads/
      
    • フルサイズ画像
      フルサイズの画像を取得するにはURLファイル(URL.txt)新しいファイル(urls-new.txt):

      sed -E "s/\/thumb//g; s/\/[0-9]+px-.+\.(jpg|png)$//g" urls.txt |
      uniq > urls-new.txt
      

      その後、ダウンロードを再開します。

      wget -i urls-new.txt -P downloads_full_size/
      

リンクされた記事のフルクレジット。

おすすめ記事