Java ではソースコード内でエスケープされた Unicode 文字が許可されるのはなぜですか? 質問する

Question

Unicode エスケープシーケンスを使用すると、ソースコードを純粋な ASCII で保存および転送しながら、Unicode 文字の全範囲を使用できます。これには 2 つの利点があります。

非 ASCII 文字を処理できないツールによって非 ASCII 文字が壊れるリスクはありません。これは、Java が設計された 1990 年代初頭には本当に懸念事項でした。非 ASCII 文字を含むメールを送信し、それが壊れずに届くことは、通常ではなく例外でした。
コンパイラとエディター/IDE に、ソースコードを解釈するためにどのエンコーディングを使用するかを伝える必要はありません。これは、依然として非常に有効な懸念事項です。もちろん、はるかに優れた解決策は、ファイルヘッダー内のメタデータとしてエンコーディングを持つこと (XML の場合など) でしたが、当時はまだこれがベストプラクティスとして登場していませんでした。

最初の方法は、プログラマーが変数やメソッドに自分の選んだ国際言語で名前を付けることができるので、私には理にかなっているように思えます。しかし、2 番目のアプローチには実用的な用途がないと思います。

どちらもまったく同じバイトコードになり、言語機能として同じ機能を持ちます。唯一の違いはソースコードにあります。

まず、下手なプログラマーがこれを利用してコードの一部を秘密裏にコメントアウトしたり、同じ変数を識別する複数の方法を作成したりする可能性があります。

プログラマーについて心配な場合は故意にコードの可読性を損なうこの言語機能は、問題としては最小のものです。

第二に、IDE 間のサポートが不足しているようです。

これは、機能やその設計者のせいではありません。しかし、この機能が「手動で」使用されることを意図していたとは思えません。理想的には、IDE には、文字を通常どおり入力して通常どおり表示し、自動的に Unicode エスケープシーケンスとして保存するオプションが必要です。IDE をそのように動作させるプラグインや構成オプションがすでにある可能性もあります。

しかし、一般的に、この機能はほとんど使用されておらず、そのためサポートも不十分であると思われます。しかし、1993 年頃に Java を設計した人々は、どうしてそれを知っていたのでしょうか?

Answer 1