他のデータを含む重複フィールドの削除

Question

AWKを使用してこれを行うことができます。

最初のソリューションegrepユーザーを除外するには、同様のコマンドを使用します。

 egrep -v 'loginName:(name1|name2)' FinalResults.txt | awk '/^loginName:/ { login=$0; } # save line
     /^memoryInfo:jsHeapSizeLimit:/ { 
         if(login!="") { # only if we have a saved loginName line
             printf "%s\t%s\n", login, $0;
             login=""; # clear to avoid printing twice
         }
     }'

問題への入力に基づいて、出力は次のようになります。

loginName:name3 memoryInfo:jsHeapSizeLimit:2181038084
loginName:name4 memoryInfo:jsHeapSizeLimit:2181038080
loginName:name5 memoryInfo:jsHeapSizeLimit:2181038080
loginName:name6 memoryInfo:jsHeapSizeLimit:2181038083

2番目の解決策拡張AWKスクリプトの使用と別ファイルのリストの除外

exclude除外するすべてのユーザーが含まれているファイルを1行に1つずつ作成するとします。

name1
name2

拡張 AWK スクリプトを使用して、excludeこのファイルを入力データファイルより前の最初のファイルとして提供できます。

awk 'NR==FNR {# condition is valid for first file only
        exclude[$0]=1; # add name to exclude map
        next; # stop processing, do not check other rules
     }
     /^loginName:/ { 
         name=substr($0,11); # extract name
         if (!( name in exclude )) login=$0; } # save line if not in exclude list
     /^memoryInfo:jsHeapSizeLimit:/ {
         if(login!="") { # only if we have a saved loginName line
             printf "%s\t%s\n", login, $0;
             login=""; # clear to avoid printing twice
         }
     }' exclude FinalResults.txt

これにより、最初のAWKスクリプトが生成されますegrep。

Answer 1