テキスト処理 - 別のディレクトリの重複ファイル名を使用して検索結果を一意にソートする方法は？

Question

find コマンドの出力が名前のファイルに保存されている場合は、filelist次のようにします。

$ awk -F/ '{f=$NF; sub(/\.Z$/,"",f)} !a[f]++' filelist
/path/to/first_directory/sample_file1_2017Dec25.dat
/path/to/first_directory/sample_file2_2017Nov01.dat
/path/to/first_directory/sample_file3_2017Oct08.dat
/path/to/second_directory/sample_file4_2017Sep11.dat
/path/to/second_directory/sample_file5_2017Oct05.dat
/path/to/third_directory/sample_file6_2017July04.dat
/path/to/third_directory/sample_file6_2017June12.dat
/path/to/third_directory/sample_file7_2017May01.dat

ファイルを生成せずに同じことを行うには、次のようにします。

find /path/to/first_directory/* /path/to/second_directory/* /path/to/third_directory/* -mtime -1 -name "filename_pattern*" | awk -F/ '{f=$NF; sub(/\.Z$/,"",f)} !a[f]++'

または、コマンドを複数行に分散させるには、次のようにします。

find /path/to/first_directory/* /path/to/second_directory/* \
  /path/to/third_directory/* -mtime -1 -name "filename_pattern*" |
    awk -F/ '{f=$NF; sub(/\.Z$/,"",f)} !a[f]++'

\bashの行は連続する文字なので、最初の行の末尾に追加します。 2行目はで終わるため、|行連続文字は必要ありません。

どのように動作しますか？

findまず、コマンドのディレクトリを優先順位に従ってリストすることが重要です。私はあなたがこれをしたことを見ます。

-F/

これは awk に/フィールド区切り文字として使用するように指示します。これはファイル名が最後のフィールドになることを意味します$NF。
f=$NF; sub(/\.Z$/,"",f)

これにより、変数にファイル名が割り当てられ、f最終ファイル名がある場合は削除さ.Zれますf。
!a[f]++'

f以前に見たことがない場合は、この行を印刷してください。

アップデート1：他の拡張機能を削除する

コメントによると、.Zこの拡張機能は削除する必要がある唯一の拡張機能ではありません。他の拡張子がある可能性があり、.dat.ediこの場合は.dat.bak単に。.dat

awk -F/ '{f=$NF; sub(/\.dat.*/,".dat",f)} !a[f]++' filelist

アップデート2：タイムスタンプでソートされたファイルを表示する：

awk -F/ '{f=$NF; sub(/\.dat.*/,".dat",f)} !a[f]++' filelist | xargs -d'\n' -r ls -t

Answer 1

find コマンドの出力が名前のファイルに保存されている場合は、filelist次のようにします。

$ awk -F/ '{f=$NF; sub(/\.Z$/,"",f)} !a[f]++' filelist
/path/to/first_directory/sample_file1_2017Dec25.dat
/path/to/first_directory/sample_file2_2017Nov01.dat
/path/to/first_directory/sample_file3_2017Oct08.dat
/path/to/second_directory/sample_file4_2017Sep11.dat
/path/to/second_directory/sample_file5_2017Oct05.dat
/path/to/third_directory/sample_file6_2017July04.dat
/path/to/third_directory/sample_file6_2017June12.dat
/path/to/third_directory/sample_file7_2017May01.dat

ファイルを生成せずに同じことを行うには、次のようにします。

find /path/to/first_directory/* /path/to/second_directory/* /path/to/third_directory/* -mtime -1 -name "filename_pattern*" | awk -F/ '{f=$NF; sub(/\.Z$/,"",f)} !a[f]++'

または、コマンドを複数行に分散させるには、次のようにします。

find /path/to/first_directory/* /path/to/second_directory/* \
  /path/to/third_directory/* -mtime -1 -name "filename_pattern*" |
    awk -F/ '{f=$NF; sub(/\.Z$/,"",f)} !a[f]++'

\bashの行は連続する文字なので、最初の行の末尾に追加します。 2行目はで終わるため、|行連続文字は必要ありません。

どのように動作しますか？

findまず、コマンドのディレクトリを優先順位に従ってリストすることが重要です。私はあなたがこれをしたことを見ます。

-F/

これは awk に/フィールド区切り文字として使用するように指示します。これはファイル名が最後のフィールドになることを意味します$NF。
f=$NF; sub(/\.Z$/,"",f)

これにより、変数にファイル名が割り当てられ、f最終ファイル名がある場合は削除さ.Zれますf。
!a[f]++'

f以前に見たことがない場合は、この行を印刷してください。

アップデート1：他の拡張機能を削除する

コメントによると、.Zこの拡張機能は削除する必要がある唯一の拡張機能ではありません。他の拡張子がある可能性があり、.dat.ediこの場合は.dat.bak単に。.dat

awk -F/ '{f=$NF; sub(/\.dat.*/,".dat",f)} !a[f]++' filelist

アップデート2：タイムスタンプでソートされたファイルを表示する：

awk -F/ '{f=$NF; sub(/\.dat.*/,".dat",f)} !a[f]++' filelist | xargs -d'\n' -r ls -t

テキスト処理 - 別のディレクトリの重複ファイル名を使用して検索結果を一意にソートする方法は？

ベストアンサー1

どのように動作しますか？

アップデート1：他の拡張機能を削除する

アップデート2：タイムスタンプでソートされたファイルを表示する：

おすすめ記事