awkを使用してHTMLファイルからURLを抽出するには?

awkを使用してHTMLファイルからURLを抽出するには?

ソースコードにJavaScriptとCSSを含むHTMLファイルがあります。 JSには、他のメタデータを含む一連のURLがリストされています。 awkを使用してURL(すべて二重引用符で囲み、前にhttp://が付く)を抽出し、そのURLを標準出力にダンプしたいと思います。ところで、awkをどのように書くかはわかりませんが、使えるツールのようです。

{
title: "Dsssat",
artist: "cxpl djij awsoj e",
mp3: "http://somesite.com/seal/dsssat.mp3",
},

ベストアンサー1

なぜawkを使うのですか?sedこれをもっとよくしてください:

sed -ne 's/.*\(http[^"]*\).*/\1/p' < foo.js

おすすめ記事