私のファイルの2番目のフィールドである同じ名前に基づいてファイルに改行文字を挿入しようとしています。したがって、私の入力ファイルは次のようになります。
17412193|name1|organization
43979400|name1|organization
1405541|name2|organization
53595498|name2|organization
50439202|name2|organization
54678379|name3|Not Found
21757330|name3|organization
だから私はこのような結果を得ようとしています。
17412193|name1|organization
43979400|name1|organization
###linebreak inserted here
1405541|name2|organization
53595498|name2|organization
50439202|name2|organization
###linebreak inserted here
54678379|name3|Not Found
21757330|name3|organization
###linebreak inserted here
この改行文字を使用して入力ファイルを分割し、同様の名前をグループ化します。後で、これらのグループ名に類似性アルゴリズムを適用します。したがって、上記の例では、出力後の3組の名前に類似性アルゴリズムを適用します。
ベストアンサー1
ファイルが2番目のフィールドにソート/グループ化されているとします。
awk -F '|' 'NR>1 && $2 != prev {print ""} {prev=$2; print}' file