HTMLページからすべてのmp3ファイルをインポートするBashスクリプト

HTMLページからすべてのmp3ファイルをインポートするBashスクリプト

.mp3HTMLページからファイルをインポートする方法を考えていましたが、手動で使用しました。wget

wget http://www.podcastfrancaisfacile.com/wp-content/uploads/files/question-prix.mp3

だから私はすべてのmp3ファイルを自動的にインポートするためにこの方法を試しました。

grep -i -E -o "content="http://www.podcastfrancaisfacile.com/wp-content/uploads/files/*.mp3" "$thread" | sed 's/ /_/g' - > "$names"

ここで、 " $thread"はhtmlファイルの名前、 " $names"は出力されるファイル名のリストです。

そして

sed -ne 's/.*\(http[^"]*\).*/\1/p' < "$thread"

関連

Ebay HTMLページからいくつかの情報を抽出するBashスクリプト

awkを使用してHTMLファイルからURLを抽出するには?

bash - 複数のリンクを含むhtmlファイルからファイル名を抽出する

ベストアンサー1

次のスクリプトは、.mp3HTMLファイルの変数に含まれるすべてのリンクまたはURLをダウンロードします$threadlynx -dump -listonlyこれは、シェルスクリプトがHTMLファイルまたはURLからURLリストを抽出する最も簡単で便利な方法の1つであることを利用します。

スクリプトを使用するには、ファイルがリストされているインデックスページのURLを知る必要があります.mp3。または、ダウンロードしたページのコピーを含むファイル名です。

http://www.podcastfrancaisfacile.com/mp3-list.htmlインデックスURLが何であるか言及していないので、偽のURLを例として使用します。正しいURLまたはファイル名に変更してください。

#! /bin/bash

thread='http://www.podcastfrancaisfacile.com/mp3-list.html'
#thread='mp3-list.html'

while IFS= read -r url ; do
  wget "$url"
done < <(lynx -dump -listonly "$thread" | awk '/\.mp3$/ {print $2}')

おすすめ記事