sedを使用してすべてのHTMLタグを削除する方法は？

Question

順序s/<[^>]*>//gは注文する処理エンジンにsed「検索と交換」を実行するように指示します。つまり-e 's/..../g'、"この検索と置換コマンドをsed。

1つのコマンドで複数のコマンドを実行すると、より意味がある可能性があります。

sed -e '1d' -e '$d'

sed処理には、「最初の行の削除」と「最後の行の削除」という2つのコマンドが追加されます。

[^>]「を除いて」を意味する正規表現です。>

したがって[^>]*、「を除くすべての文字が0個以上あることを意味します。>

so は<[^>]*>a <、必要に応じて後ろに非>、後ろを意味します>。

次に、これをシーケンスが何も置き換えられない検索と置換コマンドに入れます。それから連続して数回繰り返します（最後の時間g）。

これは、文字列がhello <abc> there <def>最初に<abc>（<次にabc「zero or more not >」、次に「」>）と一致し、それをnullに変更してからこの操作を再実行することを意味します<def>。結果は次のとおりですhello there。

（追加のスペースは削除されませんのでご注意ください！）

Answer 1