ASCII値を使用して文字列の大文字と小文字の数を見つけるには、シェルスクリプトを使用することをお勧めします。
ベストアンサー1
perl -Mopen=locale -e '
$_="@ARGV";
printf "upper: %d\nlower: %d\n", y/A-Z//, y/a-z//' -- "$myvar"
ABCDEFGHIJKLMNOPQRSTUVWXYZおよびabcdefghijklmnopqrstuvwxyz文字の発生回数が印刷されます$myvar
。
そしてzsh
:
printf 'upper: %d\nlower: %d\n' ${#myvar//[^A-Z]} ${#myvar//[^a-z]}
またはksh
:bash
upper=ABCDEFGHIJKMLNOPQRSTUVWXYZ
lower=abcdefghijklmnopqrstuvwxyz
u=${myvar//[^$upper]} l=${myvar//[^$lower]}
printf 'upper: %d\nlower: %d\n' "${#u}" "${#l}"
POSIX的に:
upper=ABCDEFGHIJKMLNOPQRSTUVWXYZ
lower=abcdefghijklmnopqrstuvwxyz
u=$(printf %s "$myvar" | tr -cd "$upper" | wc -m)
l=$(printf %s "$myvar" | tr -cd "$lower" | wc -m)
printf 'upper: %d\nlower: %d\n' "$u" "$l"
しかし、GNUのようないくつかのtr
実装はtr
互換性がなく、ASCII文字と同じエンコーディングを持つ文字部分を計算することができます。たとえば、zh_HK.big5hkscs
GNUシステムのロケールでは、次のようになります。
$ LC_ALL=zh_HK.big5hkscs luit
$ printf Э | tr -cd ABCDEFGHIJKLMNOPQRSTUVWXYZ | wc -c
1
のエンコーディングには、Э
次のエンコーディングが正確に含まれますR
。
$ printf Э | hd
00000000 c8 52 |.R|
00000002