別のディレクトリから重複した項目を繰り返し削除する

Question

以下は、その中またはその下にあるすべての一般ファイルを探し、./to_keepこれらのファイルのインラインスクリプトを一括して呼び出します。各パス名の配置について、インラインスクリプトはその下に同じ名前の一般ファイルを見つけるsh -cために一度呼び出されます。以下のファイルのパス名がfind印刷されます./to_purge（削除するには後で追加してください）。./to_purge-delete-print

find to_keep -type f -exec sh -c '
    for pathname do
        set -- "$@" -o -name "${pathname##*/}"
        shift
    done; shift
    find to_purge \( "$@" \) -type f -print' sh {} +

または、要求に応じて1行で作成します。

find to_keep -type f -exec sh -c 'for pathname do set -- "$@" -o -name "${pathname##*/}"; shift; done; shift; find to_purge \( "$@" \) -type f -print' sh {} +

インラインスクリプトは、最後の行で使用されたコマンドのORテストリストを設定します-name。ループは、外部に渡された各パス名のファイル名部分に基づいて、位置引数でfindこのリストを構成します。find

これには、スペース、タブ、改行文字など、許可されるすべてのファイル名が含まれます。もう一度削除ファイルの場合は、コードの後に-delete（または）を追加してください-exec rm {} +。-print

「ディレクトリの保持」と「ディレクトリの消去」をコマンドライン引数として使用する短いスクリプト：

#!/bin/sh

keepdir=$1
purgedir=$2

find "$keepdir" -type f -exec sh -c '
    dir=$1; shift
    for pathname do
        set -- "$@" -o -name "${pathname##*/}"
        shift
    done; shift
    find "$dir" \( "$@" \) -type f -print' sh "$purgedir" {} +

このコードの唯一の問題は、ディレクトリの名前を次のように使用することです。模様別のディレクトリでファイル名を検索するために使用されます。これは、最初のディレクトリのファイルが呼び出されると、*2番目のディレクトリのすべてのファイルが削除されることを意味します。内部ファイル名保護の問題を解決できますfind。

for pathname do
    sane=$( printf "%s\n" "${pathname##*/}" | sed "s/[[*?]/\\&/g" )
    set -- "$@" -o -name "$sane"
    shift
done; shift

インラインスクリプトsh -cのループを変更すると[、*および?文字がエスケープされます（それ以外の場合はファイル名のグロービングパターンとして使用されます）。スクリプトは次のファイル名を処理しません。終わり改行（コマンドの置き換えによる）ですが、おそらく人々が使用できるものでしょう。

Answer 1