ASCIIでエンコードされたファイルがUTF-8に拡張されるか、逆にASCIIに縮小されるのはなぜですか?
user:~$ echo 'A B C | } ~' > ./file
user:~$
user:~$ file --brief --mime ./file
text/plain; charset=us-ascii
user:~$
user:~$
user:~$ echo 'ᴁ ♫ ⼌
ベストアンサー1
「エンコーディング」と「文字セット」を混同しているようです。
最初の場合、ファイルにはUS-ASCII文字のみが含まれます。つまり、ファイルの表示に使用する言語設定に関係なく、ファイルは同じように見えます。
2 番目のケースでは、UTF8 文字セットに属する文字がファイルに含まれます。これは、UTF8文字セットにその文字を入力したためです。
ここでは変換は行われません。コマンドは単にファイルの内容を伝えます。