テキストファイルからXMLを抽出する方法

テキストファイルからXMLを抽出する方法

以下のテキストファイルがあります。

1001=<?xml ns=dkfj><home><taga>dkjf</taga></home>1002=<?xml ns=dkfj><home1><taga>dkjf</taga></home1>

次の結果が必要です。

 <?xml ns=dkfj><home><taga>dkjf</taga></home>

 <?xml ns=dkfj><home1><taga>dkjf</taga></home1>

私は前に試しましたsed、パターンを開始して終了しようとしていますが、どちらも同じ行にあるため動作しません。

どうすればいいですか?

ベストアンサー1

元の問題は
cat test.xml | tr "<" "\n" | sed -n '/taga>./p' | sed 's/taga>//'
2番目の問題で解決され、現在の問題は次に解決されます。
cat test.xml | sed 's/[0-9][0-9][0-9][0-9]=/\n/g'

4桁の数字の後に=記号が表示されるかどうかを検索するので、実際の文字列の他の場所にこの種の文字がある場合は機能しませんが、今はそうではありません。

おすすめ記事