再帰的な diff ディレクトリを作成します。参照と違いをコピーしてください。元のディレクトリを再作成します。

Question

重複排除を検討してください。新しいファイルを削除してアップロードするのではなく、サーバー上でこれらのファイルを直接変更する方法はありますか？そうでない場合は、同じファイルを直接シンボリックリンクまたはハードリンクできます。これにより、サーバーのストレージ容量が節約され、rsync -Hサポートされているハードリンクを使用するときのダウンロードの問題が自動的に解決されます。ハードリンクトラップ（1つを内部で変更すると、実際には同じファイルであるためすべてが修正されます）を知っている限り、これが最善の解決策です。

fdupesこれを使用して、重複ファイルを効率的に見つけることができます。これにはコンテンツ側の重複が含まれますが、残念ながらファイル名の要件はありません。これを使用して、重複したファイル名のリストをフィルタリングしたり直接比較したりできます。使用find、、、stat。cmp

完全に改善されていない例：

cd d1
find -type f -exec ./compare.sh d1/{} d2/{}

比較.sh:

if [ -f "$1" -a -f "$2" ]
then
    asize=`stat -c%s "$1"`
    bsize=`stat -c%s "$2"`

    if [ "$asize" == "$bsize" ]
    then
        if cmp "$1" "$2"
        then
            echo IDENTICAL "$1" "$2"
        else
            echo DIFFERENT "$1" "$2"
        fi
    fi
fi

Tarballに言及したので、それをインクルード/除外ファイルのリストに表示しますtar --files-from / --exclude-from。

Answer 1

重複排除を検討してください。新しいファイルを削除してアップロードするのではなく、サーバー上でこれらのファイルを直接変更する方法はありますか？そうでない場合は、同じファイルを直接シンボリックリンクまたはハードリンクできます。これにより、サーバーのストレージ容量が節約され、rsync -Hサポートされているハードリンクを使用するときのダウンロードの問題が自動的に解決されます。ハードリンクトラップ（1つを内部で変更すると、実際には同じファイルであるためすべてが修正されます）を知っている限り、これが最善の解決策です。

fdupesこれを使用して、重複ファイルを効率的に見つけることができます。これにはコンテンツ側の重複が含まれますが、残念ながらファイル名の要件はありません。これを使用して、重複したファイル名のリストをフィルタリングしたり直接比較したりできます。使用find、、、stat。cmp

完全に改善されていない例：

cd d1
find -type f -exec ./compare.sh d1/{} d2/{}

比較.sh:

if [ -f "$1" -a -f "$2" ]
then
    asize=`stat -c%s "$1"`
    bsize=`stat -c%s "$2"`

    if [ "$asize" == "$bsize" ]
    then
        if cmp "$1" "$2"
        then
            echo IDENTICAL "$1" "$2"
        else
            echo DIFFERENT "$1" "$2"
        fi
    fi
fi

Tarballに言及したので、それをインクルード/除外ファイルのリストに表示しますtar --files-from / --exclude-from。

再帰的な diff ディレクトリを作成します。参照と違いをコピーしてください。元のディレクトリを再作成します。

ベストアンサー1

おすすめ記事