区切りフィールドの比較

Question

表示するファイル形式が厳しく、生徒に2人の教師がいる場合は、生徒が2回だけ表示され、特定の生徒のエントリが常に隣にあると仮定すると、このコマンドを使用してすべての重複エントリを見つけることができます。このファイルの重複は、生徒に教師が何人かいることを示しているため、これを無視できます。

$ awk -F';' '{ print $1 }' file | uniq -d
jdoe

その後、ファイルは解析され、フィールド区切りスイッチをfile使用してawk分割されます-F';'。次に、awk生徒の名前である最初のフィールドのみを印刷するように指示します。次に、その出力をパイプし、重複しuniqた行だけを印刷するように指示します。

その後、forループでこの情報を使用し、上記のコマンドで返されたリストに生徒を含む行のみを印刷できます。ループのおおよその構造は次のとおりです。

$ for i in $(..cmd from above..); do 
    ... print lines that contain "$i" ...
done

ここでは、初期コマンドの出力を取得し、awkBashシェルのforループを使用して繰り返します。これは通常、ほとんどの人が初めて起動したときに取るアプローチです。

$ for i in $(awk -F';' '{ print $1 }' file | uniq -d); do \
    grep "^$i;" file; done
jdoe;ateacher
jdoe;bteacher

この方法は効果的ですが、いくつかの問題もあります。ファイル名にスペースが含まれていると、この方法は失敗します。 whileループを使用してより複雑なアプローチに切り替えることができます。

$ while read; do grep "^$i;" file; done \
    < <(awk -F';' '{ print $1 }' file | uniq -d)
jdoe;ateacher
jdoe;bteacher

ここではコマンドの出力を取得し、次のようにwhileループに渡します。

$ while read; do .... ; done < <(...our command...)

これの利点は、この表記法を使用して一時ファイルを作成し、すべての結果をwhileループに行として渡すことができることです。したがって、このreadコマンドはforループの実装では、空白ではなく改行区切りの結果のみを解析します。

< <(...command...)

forループとスペースを使用すると、次のことが起こります。

$ for i in jdoe john smith jjill;do echo "$i"; done
jdoe
john
smith
jjill

Answer 1