2010 年に、大規模な Web ポータルで UTF-8 文字を含む URL を提供しますか?
URLに関するRFCではUnicode文字は禁止されています(ここ)。標準に準拠するには、パーセントエンコードする必要があります。
ただし、私の主なポイントは、見栄えの良い URL を作成するためだけにエンコードされていない文字を提供することです。したがって、パーセント エンコーディングは使用しません。
RFC に何が書かれていても、すべての主要ブラウザはこれらの URL を正常に解析しているようです。しかし、私の全体的な印象としては、Web ブラウザの領域を離れると、非常に不安定になるということです。
- URL がテキストファイル、電子メール、さらには異なるエンコードの Web サイトにコピー&ペーストされる
- HTTP クライアント ライブラリ
- 珍しいブラウザ、RSSリーダー
ここではトラブルが予想されるため、非技術者向けのコンテンツを提供する場合、引用されて渡された場合でもすべてのリンクが適切に機能することが重要であるという私の印象は正しいでしょうか。したがって、これは (まだ) 実用的な解決策ではありません。
HTMLで見栄えの良いURLを提供する魔法のような方法はあるのでしょうか?
http://www.example.com/düsseldorf?neighbourhood=Lörick
特殊文字をそのままコピーして貼り付けることができ、古いクライアントで再利用すると正しく動作するものはありますか?
ベストアンサー1
パーセントエンコーディングを使用します。最新のブラウザは表示と貼り付けの問題を処理し、人間が読める形式にします。例:http://ko.wikipedia.org/wiki/위키백과:대문
編集:Firefox でこのような URL をコピーすると、クリップボードにはパーセントエンコードされた形式が保持されます (通常はこれで問題ありません)。ただし、URL の一部だけをコピーした場合は、エンコードされないままになります。