btrfsの重複排除の意味 - 異なるメタデータ、同じファイルデータ

btrfsの重複排除の意味 - 異なるメタデータ、同じファイルデータ

だから私は読んだこのウィキの記事重複排除のためのbtrfs使用情報。ただし、btrfs 重複排除によるセマンティクスは説明しません。

12個のファイルがあるとしましょう。すべて同じデータを含みますが、ユーザーとグループの所有権と権限(拡張属性、ACLなど)は異なる場合があります。

Btrfsの重複排除機能を使用すると、ディスクサイズを以前のフルサイズの約1/12に縮小できますか?

ハードリンクは、その意味が共有されているメタデータ(所有権、権限)を暗示しているため、明らかに機能しません。

私のカーネルバージョンは3.16です。

ベストアンサー1

重複排除はブロックレベルで発生します。ファイルの内容が同じですが、メタデータが異なる場合、システムが完全に重複排除されたと仮定すると、コンテンツ全体が一度だけ保存されます。重複排除は、ファイルが部分的に同じであってもスペースを節約できます。たとえば、2バイトのチャンクがあり、次を含むファイルがある場合

file1 = ABCD
file2 = AABAAB
file3 = AAB

その後、5つのブロックに保存されます。

file1 = block1,block2
file2 = block3,block4,block1
file3 = block3,block5

cp -al同じディレクトリ(たとえば、ファイルレベルの重複排除増分バックアップ、または同様の結果のために同じ名前と同じinode番号を持つファイルを含むディレクトリ)がある場合は、同じブロックに保存することもできます。

おすすめ記事