解析:html行からバージョンを抽出する

解析:html行からバージョンを抽出する

この文字列からバージョン番号を抽出したいと思います。

<a href="/url/version/tree/1.0.1alpha11" class="css-truncate">

" /url/version/tree/"は変更される可能性があります(例:から)、バージョンも変更される可能性があります(例:/url/version/tree/から)。/url/version2/tree1/)1.01alpha112.0stable

思考/提案?

ベストアンサー1

sed解決策:

サンプルファイルinput.txt:

<a href="/url/version/tree/1.0.1alpha11" class="css-truncate">
<a href="/url/version2/tree1/1.0.2alpha11" class="css-truncate">
<a href="/url/version/tree/2.0stable" class="css-truncate">

sed -En 's@.*\<href="/[^[:space:]]+/([^/"[:space:]]+).*@\1@p' input.txt

出力:

1.0.1alpha11
1.0.2alpha11
2.0stable

おすすめ記事