ディレクトリに同じファイル名を持つ.xlsxファイルがある場合は、.pdfファイルのみを削除しますか?

ディレクトリに同じファイル名を持つ.xlsxファイルがある場合は、.pdfファイルのみを削除しますか?

法的電子情報開示システムから大量にエクスポートされた数百のフォルダpdfとファイルがあります。xls(x)これらのエクスポートのファイル名はbates#に対応します(たとえば、、、ABCD_00000001.pdf... ABCD_00000002.pdf、)ABCD_00002000.pdfpdfすべて xls(x)ファイル - どちらもまったく同じファイル名を持ちます。たとえば、ABCD_00000005.xlsxediscoveryシステムで生成されたxlsxファイルであり、ABCD_00000005.pdf一括エクスポートで生成された無関係の空のpdfファイルです。

これらの外部.pdfファイルは、一括エクスポートを実行している人のユーザーエラーが原因で発生する可能性がありますが、通常、プロセスのこの側面を制御することはできません。したがって、誰かが手動で確認することを強制することなく、これらの無関係な.pdfを削除する比較的簡単な方法があるかどうか疑問に思います。

ベストアンサー1

基本名を抽出するには、パラメータ拡張を使用してPDFファイルを繰り返します。

#!/bin/bash
for pdf in *.pdf ; do
    basename=${pdf%.pdf}
    if [[ -f $basename.xls || -f $basename.xlsx ]] ; then
        rm "$pdf"
    fi
done

修正する:私のロジックは逆になっているので、今修正する必要があります。

おすすめ記事