さまざまなフォーラムで、以下のような Zalgo という奇妙な形式のテキストが書かれているのを見ました。見ていてちょっとイライラしますが、文字がどうあるべきかという私の考えを覆すので、本当に気になります。私の理解では、文字は行を横切って水平に移動し、特定の「コンテナ」内に留まるはずです。明らかに、Zalgo テキストは垂直に移動しており、スペースに制限されていないようです。
これは Unicode のバグ/欠陥/エクスプロイト/ハックでしょうか? これらの個々の文字は奇妙な特性を持っていますか? ここでは「何」が起こっているのでしょうか?
どうやって̸̤͓̞̱̫ͩͩ͑̋̀ͮͥͦ̊Z̆̊͊҉҉̠̱̦̩͕ą̟̹͈̺̹̋̅ͯĺ̡̘̹̻̩̩͋͘g̪͚͗ͬ͒o̢̖͇̬͍͇͓̔͋͊̓ ̢͈͙͂ͣ̏̿͐͂ͯ͠t̛͓̖̻̲ͤ̈ͣ͝e͋̄ͬ̽͜҉͚̭͇ͅx͎̬̠͇̌ͤ̓̂̓͐́͋͡ț̗̹̝̄̌̀ͧͩ̕͢ ̮̗̩̳̱̾w͎̭̤͍͇̰̄͗ͭ̃͗ͮ̐o̢̯̻̰̼͕̾ͣͬ̽̔̍͟ͅr̢̪͙͍̠̀ͅǩ̵̶̗̮̮ͪ́?̙͉̥̬͙̟̮͕ͤ̌͗ͩ̕͡
ベストアンサー1
テキストには結合文字(結合マークとも呼ばれる)が使用されています。Unicode標準における文字の組み合わせ(PDF)。
Unicodeでは、文字のレンダリングは、各グリフが所定の高さのボックスに収まる単純な文字セルモデルを使用しません。結合記号は、基本文字の上、下、または内部にレンダリングされることがあります。
したがって、レンダリング ソフトウェアが Unicode レンダリング モデルに準拠していると仮定すると、基本文字と「上を結合する」マークで構成される任意の長さの文字シーケンスを簡単に作成して、任意の視覚的な高さを実現できます。このようなシーケンスには当然意味はなく、サルでも作成できます (たとえば、適切なドライバーを備えたキーボードが与えられている場合)。
また、「上を結合」マークと「下を結合」マークを混在させることもできます。
質問のサンプルテキストは次の文で始まります:
- ラテン大文字 H-
H
- 結合ラテン小文字T-
ͭ
- ギリシャのコロニスを組み合わせる-
̓
- 結合カンマ-
̓
- 上の結合点-
̇