ファイルからURIを抽出する方法

ファイルからURIを抽出する方法

特定の数のファイルからすべてのURIを抽出する方法はmagnet: file:?各行にURIを出力として含めたい。これを達成するためにbashを使用したいのですが、どんな提案でも歓迎します。私はDebian 7を使用しています。

入力は、任意の名前を持つHTMLファイルの束です。 URIはすべてa hrefHTMLタグになっています(例:)<a href='magnet:?xt=something1:something1:somerandomcharacters'>link text</a>。各ファイルにURIがどのように格納されるかについてのスキームはありません。Nファイルの任意の場所に配置できる各ファイルのURI。

予想される出力は、改行で区切られた値を含むリストでなければなりません。たとえば、次のようになります。

magnet:?xt.......
magnet:?xt.......
magnet:?xt.......

ベストアンサー1

URIが空白で終わるようです。grep -o 'magnet://[^ ]*' filename

修正する:grep -o "magnet:?xt[^']*" filename

修正するcat * | grep -o "magnet:?xt[^']*"またはgrep -oh "magnet:?xt[^']*" *

おすすめ記事