ファイル名から与えられた文字列の前に現れる数字を抽出するには？

Question

grepこの-oフラグを知っている実装を使用して、次のようにしますtr。

#!/bin/sh

printf '%s\n' "$@" | grep -oiE '[0-9]+[^0-9]*booklets' | tr -dc '0-9\n'

これはスクリプトです（動作しますがスクリプトshではありません）。コマンドラインから渡された文字列にリテラル改行文字が含まれていないとします。bashbash

拡張正規表現はandなどの文字列[0-9]+[^0-9]*bookletsと一致し、これは正確にそれから返されます。数字または改行文字を除く出力のすべての項目を削除します。<integer><zero or more non-digit characters><"booklets">-ogreptrgrep

文字列から数字ではなく、最初の文字内のすべての内容を削除するtrことで置き換えることができます。sed 's/[^0-9].*//'

テストしてみてください：

$ sh script.sh 101s18-exam02--100-booklets.pdf
100
$ sh script.sh "MATH232 Exam 01 99 booklets.pdf"
99
$ sh script.sh 35BOOKLETS.pdf
35

$ sh script.sh 101s18-exam02--100-booklets.pdf "MATH232 Exam 01 99 booklets.pdf" 35BOOKLETS.pdf
100
99
35

スペースを含む文字列は引用符で囲む必要があります。

Answer 1

grepこの-oフラグを知っている実装を使用して、次のようにしますtr。

#!/bin/sh

printf '%s\n' "$@" | grep -oiE '[0-9]+[^0-9]*booklets' | tr -dc '0-9\n'