UTF-8ファイルのページを埋め、正しい文字を表示するにはどうすればよいですか?

UTF-8ファイルのページを埋め、正しい文字を表示するにはどうすればよいですか?

UTF-8を含むファイルにcatを使用すると正しく表示されます。

% cat /tmp/sample
<concept code="endangeredLanguage">
  <description value="The language is endangered at the given date"@en/>
  <description value="La lengua está en vías de extinción en la fecha dada"@es/>
  <description value="O idioma está em vias de extinção na data indicada"@pt/>
  <description value="La langue est menacée à la date indiquée"@fr/>
  <description value="ある時点でその言語は絶滅寸前である"@ja/>
  <description value="De taal is bedreigd met uitsterven op de gegeven datum"@nl/>
</concept>

ただし、「less」を使用すると、ASCII以外の文字はエスケープされます。

% less /tmp/sample
<concept code="endangeredLanguage">
  <description value="The language is endangered at the given date"@en/>
  <description value="La lengua est<C3><A1> en v<C3><AD>as de extinci<C3><B3>n en la fecha dada"@es/>
  <description value="O idioma est<C3><A1> em vias de extin<C3><A7><C3><A3>o na data indicada"@pt/>
  <description value="La langue est menac<C3><A9>e <C3><A0> la date indiqu<C3><A9>e"@fr/>
  <description value="<E3><81><82><E3><82><8B><E6><99><82><E7><82><B9><E3><81><A7><E3><81><9D><E3><81><AE><E8><A8><80><E8><AA><9E><E3><81><AF><E7><B5><B6><E6><BB><85><E5><AF><B8><E5><89><8D><E3><81><A7><E3><81><82><E3><82><8B>"@ja/>
  <description value="De taal is bedreigd met uitsterven op de gegeven datum"@nl/>
</concept>

それはおそらくlessがバイナリとして扱うからです。出力のページを付けましたが、まだ正しい文字を見ることができる方法は何ですか?

ベストアンサー1

lessFAQで説明されています。英語以外の文字をあまり表示できませんか?

Lessには英語以外の文字を表示する2つの方法があります。システムがASCIIではなくシングルバイト文字セットを使用している場合は、正しいロケール設定でシステムを設定する必要があります。システムがsetlocaleをサポートしていない場合は、環境変数を設定して、使用している言語を簡単に知ることができLESSCHARSETますLESSCHARDEF。詳細については、マニュアルページの「国別文字セット」セクションを参照してください。

システムが非ASCIIテキストのUnicode UTF-8エンコーディングをサポートしている場合(多くの最新システムでサポートされている場合)、ロケールに「UTF-8」または「UTF8」(大文字または小文字の両方が使用可能)を含めるように設定するか、またはLESSCHARSET「UTF- 8"。

おすすめ記事