文字列入力で大文字と小文字の数を計算するシェルスクリプト

Question

perl -Mopen=locale -e '
  $_="@ARGV";
  printf "upper: %d\nlower: %d\n", y/A-Z//, y/a-z//' -- "$myvar"

ABCDEFGHIJKLMNOPQRSTUVWXYZおよびabcdefghijklmnopqrstuvwxyz文字の発生回数が印刷されます$myvar。

そしてzsh：

printf 'upper: %d\nlower: %d\n' ${#myvar//[^A-Z]} ${#myvar//[^a-z]}

またはksh：bash

upper=ABCDEFGHIJKMLNOPQRSTUVWXYZ
lower=abcdefghijklmnopqrstuvwxyz
u=${myvar//[^$upper]} l=${myvar//[^$lower]}
printf 'upper: %d\nlower: %d\n' "${#u}" "${#l}"

POSIX的に：

upper=ABCDEFGHIJKMLNOPQRSTUVWXYZ
lower=abcdefghijklmnopqrstuvwxyz
u=$(printf %s "$myvar" | tr -cd "$upper" | wc -m)
l=$(printf %s "$myvar" | tr -cd "$lower" | wc -m)
printf 'upper: %d\nlower: %d\n' "$u" "$l"

しかし、GNUのようないくつかのtr実装はtr互換性がなく、ASCII文字と同じエンコーディングを持つ文字部分を計算することができます。たとえば、zh_HK.big5hkscsGNUシステムのロケールでは、次のようになります。

$ LC_ALL=zh_HK.big5hkscs luit
$ printf Э | tr -cd ABCDEFGHIJKLMNOPQRSTUVWXYZ | wc -c
1

のエンコーディングには、Э次のエンコーディングが正確に含まれますR。

$ printf Э | hd
00000000  c8 52                                             |.R|
00000002

Answer 1

perl -Mopen=locale -e '
  $_="@ARGV";
  printf "upper: %d\nlower: %d\n", y/A-Z//, y/a-z//' -- "$myvar"