重複した行を削除するように指示しますが、.txt ファイルにいくつかの変更があります。

Question

$ awk -F: '$1 != p && /RESULT/ { print; p = $1 }' file
ligand_06278/out.pdbqt:REMARK VINA RESULT:      -8.3      2.094      2.612
ligand_06279/out.pdbqt:REMARK VINA RESULT:      -6.1      9.841     13.115
ligand_06280/out.pdbqt:REMARK VINA RESULT:     -10.0      3.811      7.264

RESULTこれにより、入力ファイルに記載されている各ファイルの最初の行が出力されます。最初の列（ファイル名）を前の行の最初の列と比較し、現在の行に単語が含まれているかどうかをテストしてこれを行いますRESULT。前の行とファイル名が異なる行が見つかると、その行は更新された値RESULTでそのまま印刷されます。p

入力ファイルがgrep複数のファイルを実行した結果（おそらくgrep search）と非常によく似ていることがわかりましたREMARK。

すべてのファイルを検索し、各ファイルに一致する最初の行を取得するには、次の手順を実行しますREMARK VINA RESULT。

find . -type f -path './ligand_*' -name 'out.pdbqt' -exec sed -n '/REMARK VINA RESULT/{p;q;}' {} ';'

または簡単なループで：

for name in ligand_*/out.pdbqt; do
    grep -F 'REMARK VINA RESULT' "$name" | head -n 1
done

ここではさまざまな方法を使用しましたが、最も自然に感じる方法を選択してください。

Answer 1

$ awk -F: '$1 != p && /RESULT/ { print; p = $1 }' file
ligand_06278/out.pdbqt:REMARK VINA RESULT:      -8.3      2.094      2.612
ligand_06279/out.pdbqt:REMARK VINA RESULT:      -6.1      9.841     13.115
ligand_06280/out.pdbqt:REMARK VINA RESULT:     -10.0      3.811      7.264