ファイルから特定の文字列を抽出するには？

Question

これを行う方法はいくつかあります。たとえば、

grep
```
grep -oP 'BIG\*20021208\*00001\**\K[A-Z0-9-]+' file
```
説明する

-ogrepは一致する行部分のみを印刷して-P有効にします。Perl互換正規表現(PCRE) 構文。 PCREでは、\Kその点まで一致するすべての項目が削除されます（したがって印刷されません-o）。[A-Z0-9-]はキャラクタークラスAからZまでの大文字、数字、または-を1回以上繰り返すことができます（+）。

ターゲット文字列に小文字を含めることができる場合は、その-iフラグを使用してgrepを実行するか、文字クラスを[a-zA-Z0-9-]。

- - または - -
```
grep -oP 'BIG\*20021208\*00001\**\K.+(?=…)' file
```
説明する

これは上記と同じで、ここにのみ肯定的な予測（）があります。つまり、aの前に来る場合にのみ一致するという(?=…)意味です。.+…
sed
```
sed -rn 's/…//g;s/.*BIG\*20021208\*00001\**//p;' file
```
説明する

s/from/to/sedの代替演算子です。fromに置き換えられますto。最初の項目は…何も置き換えずに削除します（g行内のすべての一致に対してこれが行われたことを確認してください）。 2番目は、（.*）からBIG*20021208*00001（*正規表現で特別な意味を持つため）エスケープする必要がある行の先頭からすべての項目を削除し、ゼロ個以上の\*アスタリスク（）を削除します。\**組み合わせると、必要なものを除くすべてが削除されます。

-nいかなる出力も印刷できません。最後の2番目の代替演算子は、psedが置換に成功したすべての嘘を印刷するようにします。
アッ
```
awk -F'[*…]' '/BIG\*20021208\*00001\**/{print $(NF-1)}' file
```
説明する

-Fawkの入力フィールド区切り記号をまたは*に設定します…。これは、最後から2番目のフィールドが目的のフィールドになることを意味します。上記のコマンドは一致する行に印刷しますBIG*20021208*00001*。
真珠
```
perl -lne '/BIG\*20021208\*00001\**(.*)…/ && print "$1"' file
```
説明する

-nPerlに入力を1行ずつ読み、与えられたスクリプトを適用させます-e。各呼び出しに-l改行文字を追加しますprint。上記のコマンドは、関心のある文字列（上記のsedの例の説明を参照）と一致することを確認し、成功すると印刷します。

awkの例と同じアプローチを使用することもできます。
```
perl -F'[*…]' -lane '/BIG\*20021208\*00001\**/ && print "$F[$#F]"' file
```

Answer 1

これを行う方法はいくつかあります。たとえば、

grep
```
grep -oP 'BIG\*20021208\*00001\**\K[A-Z0-9-]+' file
```
説明する

-ogrepは一致する行部分のみを印刷して-P有効にします。Perl互換正規表現(PCRE) 構文。 PCREでは、\Kその点まで一致するすべての項目が削除されます（したがって印刷されません-o）。[A-Z0-9-]はキャラクタークラスAからZまでの大文字、数字、または-を1回以上繰り返すことができます（+）。

ターゲット文字列に小文字を含めることができる場合は、その-iフラグを使用してgrepを実行するか、文字クラスを[a-zA-Z0-9-]。

- - または - -
```
grep -oP 'BIG\*20021208\*00001\**\K.+(?=…)' file
```
説明する

これは上記と同じで、ここにのみ肯定的な予測（）があります。つまり、aの前に来る場合にのみ一致するという(?=…)意味です。.+…
sed
```
sed -rn 's/…//g;s/.*BIG\*20021208\*00001\**//p;' file
```
説明する

s/from/to/sedの代替演算子です。fromに置き換えられますto。最初の項目は…何も置き換えずに削除します（g行内のすべての一致に対してこれが行われたことを確認してください）。 2番目は、（.*）からBIG*20021208*00001（*正規表現で特別な意味を持つため）エスケープする必要がある行の先頭からすべての項目を削除し、ゼロ個以上の\*アスタリスク（）を削除します。\**組み合わせると、必要なものを除くすべてが削除されます。

-nいかなる出力も印刷できません。最後の2番目の代替演算子は、psedが置換に成功したすべての嘘を印刷するようにします。
アッ
```
awk -F'[*…]' '/BIG\*20021208\*00001\**/{print $(NF-1)}' file
```
説明する

-Fawkの入力フィールド区切り記号をまたは*に設定します…。これは、最後から2番目のフィールドが目的のフィールドになることを意味します。上記のコマンドは一致する行に印刷しますBIG*20021208*00001*。
真珠
```
perl -lne '/BIG\*20021208\*00001\**(.*)…/ && print "$1"' file
```
説明する

-nPerlに入力を1行ずつ読み、与えられたスクリプトを適用させます-e。各呼び出しに-l改行文字を追加しますprint。上記のコマンドは、関心のある文字列（上記のsedの例の説明を参照）と一致することを確認し、成功すると印刷します。

awkの例と同じアプローチを使用することもできます。
```
perl -F'[*…]' -lane '/BIG\*20021208\*00001\**/ && print "$F[$#F]"' file
```

ファイルから特定の文字列を抽出するには？

ベストアンサー1

説明する

説明する

説明する

説明する

説明する

おすすめ記事