sed eval フラグを使用して、「/U+[0-9A-Fa-f]{4}/」をシェルパイプラインの正しい Unicode 文字に置き換えます。

2024-06-22 • tag-icon

sed eval フラグを使用して、「/U+[0-9A-Fa-f]{4}/」をシェルパイプラインの正しい Unicode 文字に置き換えます。

ファイルにリストされている既存の文字を正しく可視化しようとしています/usr/include/X11/keysymdef.h。

次の行があります。

#define XK_onethird    0x0ab0  /* U+2153 VULGAR FRACTION ONE THIRD */
#define XK_twothirds   0x0ab1  /* U+2154 VULGAR FRACTION TWO THIRDS */
#define XK_onefifth    0x0ab2  /* U+2155 VULGAR FRACTION ONE FIFTH */

次のように表示したいと思います。

#define XK_onethird    0x0ab0  /* ⅓ VULGAR FRACTION ONE THIRD */
#define XK_twothirds   0x0ab1  /* ⅔ VULGAR FRACTION TWO THIRDS */
#define XK_onefifth    0x0ab2  /* ⅕ VULGAR FRACTION ONE FIFTH */

私は試した:

$ sed -e 's/U+\([0-9A-Fa-f]\{4\}\)/\u\1/' < /usr/include/X11/keysymdef.h

これは単に「無視」されます\u。だから少し煮てください。sedPilcrow "¶"を使用したテストケース：

$ echo 00B6 | sed -re $'s/(....)/echo "\u00B6"/e'
¶       # Good, display works, lets get the capture group:
$ echo 00B6 | sed -re $'s/(....)/echo "\u00B6 \\1"/e'
¶ 00B6  # So far, so good, lets prefix \u again:
$ echo 00B6 | sed -re $'s/(....)/echo "\u00B6 \u\\1"/e'
¶ 00B6  # Huh? Ok, trying double-wrapping
$ echo 00B6 | sed -re $'s/(....)/echo "\u00B6 \\u\\1"/e'
¶ 00B6  # Hey, where did the '\\u' go? Ok, try something else:
$ echo 00B6 | sed -re $'s/(....)/echo $(echo "\u00B6 \u\\1")/e'
¶ 00B6  # I give up

（注：上記のバリエーションも試しましたprintf。変更はありません。）

私は何を見逃していますか？評価フラグが利用できない理由sedそうですか？

編集：この問題は他の言語/ツールで解決することができ、while read echo eval（+ 1d）答えてくれてありがとう。

しかし、私がこの問題に最も興味を持っているのは解決策です。sedまたは、上記のコマンドがこの出力を生成する理由および/またはこれが不可能な理由を調べてください。

ベストアンサー1

パールの使用：

perl -CS -pe 's/\bU\+([\dA-Fa-f]{4})\b/chr(hex($1))/eg' /usr/include/X11/keysymdef.h

これはPerlにを見つけて16進数にU+0000変換し、0000その数字が表す文字に置き換えるように指示します。

ファイルの内容を変更するには、次のようにします。

perl -i -CD -pe 's/\bU\+([\dA-Fa-f]{4})\b/chr(hex($1))/eg' /path/to/file

ベストアンサー1

おすすめ記事