ファイルに 1 行だけ残るまでシェルスクリプトを実行します。

Question

ファイルが正しい形式のXMLファイルであり、<text>ノードを別々のファイルに抽出したい場合は、XMLStarletを使用して次のことを実行できます。

#!/bin/sh

infile="$1"

xmlstarlet sel -t -v '//text/@id' -nl "$infile" |
while read id; do
    xmlstarlet sel -t --var id="'$id'" -v '//text[@id = $id]' "$infile" >"$id.txt"
done

コマンドラインに次のファイルのパス名を入力します。

<?xml version="1.0"?>
<root>
  <text id="cade2296-1">
The first text, called "cade2296-1".
</text>
  <text id="cafr3062-1">
The second text, called "cafr3062-1".
</text>
</root>

...これは現在のディレクトリに2つのファイルを作成し、cade2296-1.txt元cafr3062-1.txtのファイルの2つのタグの内容を含みます。<text>

ファイル名はラベルidの属性から取得されます<text>。idこれらの値は最初にXMLから抽出され、次にループから関連タグ値を抽出するために使用されます。

ループ内でXMLStarlet呼び出しを次-vのように変更すると、次のような結果が得られます。-cコピー<text>タグのデータだけでなく、XMLタグのコンテンツです。

Answer 1

ファイルが正しい形式のXMLファイルであり、<text>ノードを別々のファイルに抽出したい場合は、XMLStarletを使用して次のことを実行できます。

#!/bin/sh

infile="$1"

xmlstarlet sel -t -v '//text/@id' -nl "$infile" |
while read id; do
    xmlstarlet sel -t --var id="'$id'" -v '//text[@id = $id]' "$infile" >"$id.txt"
done

コマンドラインに次のファイルのパス名を入力します。

<?xml version="1.0"?>
<root>
  <text id="cade2296-1">
The first text, called "cade2296-1".
</text>
  <text id="cafr3062-1">
The second text, called "cafr3062-1".
</text>
</root>

...これは現在のディレクトリに2つのファイルを作成し、cade2296-1.txt元cafr3062-1.txtのファイルの2つのタグの内容を含みます。<text>

ファイル名はラベルidの属性から取得されます<text>。idこれらの値は最初にXMLから抽出され、次にループから関連タグ値を抽出するために使用されます。

ループ内でXMLStarlet呼び出しを次-vのように変更すると、次のような結果が得られます。-cコピー<text>タグのデータだけでなく、XMLタグのコンテンツです。

ファイルに 1 行だけ残るまでシェルスクリプトを実行します。

ベストアンサー1

おすすめ記事