文字列から数字の前の単一文字を抽出する方法

Question

grep私は質問にandとタグ付けしたので、文字列リストがいくつかのsedテキスト入力の1行に1つの項目として表示されるとします。

それから：

sed -n 's/^.*\([^[:digit:]]\)[[:digit:]]\{1,\}$/\1/p' < that-input

または（GNUgrepまたは互換ビルドにPerlと同様の正規表現サポートがあると仮定）：

grep -Po '\D(?=\d+$)' < that-input

数字以外の文字で終わる行の末尾の数字の前に数字以外の文字を出力し、その後に1つ以上の数字が続きます。

どちらもマッチングに正規表現を使用しますが、デフォルトの正規表現とsedPerlgrep -Pに似た正規表現を使用します。

一部のsed実装では-Pこれをサポートしていますが、最も一般的ではありません。-E正規表現の別の方言である拡張正規表現のさまざまなサポート。そしてそれら：

sed -E -n 's/^.*([^[:digit:]])[[:digit:]]+$/\1/p' < that-input

あるいは、単独perlで使用することもできます：

perl -lne 'print $1 if /(\D)\d+$/' < that-input

（perlデフォルトでは文字レベルではなくバイトレベルで動作します。入力をUTF-8文字として解釈するか、通常どおりロケールエンコーディングに従って入力/出力をデコード/エンコードするように指示する-Cオプションを参照してください。）-Mopen=localegrepsed

あるいは、libpcre（GNUによって使用されるライブラリ）に付属する実装例pcregrep：grepgrep -P

pcregrep -o1 '(\D)\d+$' < that-input

Answer 1