エンコードの問題により、同じファイルのファイル名が異なります。

Question

Unixファイルシステムは、ファイル名がバイトで構成されているため、ロケールに依存しない傾向があり、そのバイトがASCIIの範囲外の場合、その意味を決定するのはアプリケーションによって異なります。今日のUnixの慣例は、UTF-8を使用して、いくつかのレガシー環境（主にアジア環境）を除いて、ファイル名やその他すべてをエンコードすることです。一方、Windowsファイルシステムはファイルシステムプロパティにエンコードされている傾向があります。

別の方法でエンコードされたファイル名を使用する必要がある場合は、次のコマンドを使用してそのファイルシステムの翻訳ビューを作成します。ファイルシステム変換。バラより SSHで異なるエンコードされたファイル名を使用する

元のシステムには、latin-1でエンコードされたファイル名があるようです。現在のシステムはUTF-8を使用しており、ålatin-1（）で表されるシングルバイトシーケンスは、として印刷された\345UTF-8の無効なシーケンスです。バックアップ処理のため、ファイル名はUTF-8でエンコードされます。 Samba は設定に従ってファイル名を変換します。ls?

デフォルトのエンコードを使用して元のファイルにアクセスするには、再エンコードされたビューを作成します。

mkdir /original-recoded
convmvfs -o icharset=LATIN1,ocharset=UTF8 /original /original-recoded
diff -r /original-recoded /frombackup

（持ちたい権限と所有権によっては、他のオプションが必要になる場合があります。）

Answer 1

Unixファイルシステムは、ファイル名がバイトで構成されているため、ロケールに依存しない傾向があり、そのバイトがASCIIの範囲外の場合、その意味を決定するのはアプリケーションによって異なります。今日のUnixの慣例は、UTF-8を使用して、いくつかのレガシー環境（主にアジア環境）を除いて、ファイル名やその他すべてをエンコードすることです。一方、Windowsファイルシステムはファイルシステムプロパティにエンコードされている傾向があります。

別の方法でエンコードされたファイル名を使用する必要がある場合は、次のコマンドを使用してそのファイルシステムの翻訳ビューを作成します。ファイルシステム変換。バラより SSHで異なるエンコードされたファイル名を使用する

元のシステムには、latin-1でエンコードされたファイル名があるようです。現在のシステムはUTF-8を使用しており、ålatin-1（）で表されるシングルバイトシーケンスは、として印刷された\345UTF-8の無効なシーケンスです。バックアップ処理のため、ファイル名はUTF-8でエンコードされます。 Samba は設定に従ってファイル名を変換します。ls?

デフォルトのエンコードを使用して元のファイルにアクセスするには、再エンコードされたビューを作成します。

mkdir /original-recoded
convmvfs -o icharset=LATIN1,ocharset=UTF8 /original /original-recoded
diff -r /original-recoded /frombackup

（持ちたい権限と所有権によっては、他のオプションが必要になる場合があります。）

エンコードの問題により、同じファイルのファイル名が異なります。

ベストアンサー1

おすすめ記事