端末からUnicodeシンボルを削除する方法は？

Question

これは実際には4つの質問です。

OPではxtermに言及しましたが、最後の2つだけがxtermに固有のものです。

（1）と（2）の場合、echoコマンドはあまり役に立ちません。使えばいいと思います。printf、バックスラッシュエスケープを認識します。いくつかの実装では（例：GNUコアツール）（Unicode定数を含む）

printf '\u94f6\btest'

たとえ一般的な表現、Perl（UTF-8を扱うことができます）などのスクリプト言語を使用することをお勧めします。

追加資料：

質問（3）と（4）がもっと面白いです。まず、スクリプトは文字列に必要な文字単位の数を事前に知ることができず、事実後にのみ測定できます。これは、幅が端末とカーネルの動作の組み合わせに基づいているためです。

xtermの使用幅文字の幅を決定するには、「ワイド」（デュアル幅）フォントにいくつかの問題があり、wcwidthの実装はあいまいな幅のUnicode値に対する開発者の偏見を反映しています。 Markus Kuhnのコピーを使用するようにxtermを（実行時に）設定できます。実装するwcwidth;実際のシステムロケール情報が完全でなく一致しない可能性があります。
xterm が 2 バイト文字の一部を消去するよう指示すると (与えられた例のように) 他の部分を空白で置き換えます。 xtermを模倣する他のほとんどの端末はこれを行います（迅速な検査により、1つの端末が単にカーソルを動かして広い文字とASCIIテキストが重なることを発見しました）。もしあなたなら知る値は倍幅で、カーソルがある位置の概念を簡単に調整できます。
それ以降のLinuxカーネルとwcwidthLinuxベースのシステム2004年stty次の機能がありますiutf8。

標準入力モードで正しい編集サポートを提供するために、入力がUTF-8でエンコードされたことをカーネルに通知します。

編集に役立つLinuxカーネル機能入力するこれは、バックスペースキーが古い文字を削除したときにターミナルドライバが合理的な操作を実行するのに役立ちます。しかし、比較する機能はありません。出力。

あなたできる、推奨されるようにカーソル位置の報告（エスケープシーケンス）を使用して、さまざまな点でカーソル位置を見つけます。しかし、それを使って線を消去する方法を決定すると、もっと簡単に見えます。移動するUnicode値を印刷する前の位置に移動し、その点から削除します。

あるいは、ワイド文字を印刷する前にカーソル位置を保存してから復元（戻る）するように端末に指示することもできます。これはよりクリーンで予測可能に見えるかもしれません。カーソル位置が復元されると、その行を消去できます。どちらもエスケープシーケンスを使用して実行できます。tput:

tput sc
printf '\u94f6'
tput rc
tput el
printf 'test'

デモに加えて、端末に保存されているカーソル位置が1つだけで、単一/二重幅文字が消去されるように行全体が消去されるという欠点があります。しかし、カーソルは最終的に「正しい」位置に達します。

Answer 1