別のファイルにコピーできるようにファイルを読み、特定の文字列が最初に表示される部分を検索する必要があります。

Question

Kusalanandaが正確で、各従業員の記録がlineで始まると仮定すると、empid次のawkコマンドが機能します。

awk -F';' '$1=="empid" {delete a} !a[$1]++' input.txt > output.txt

これは、配列変数を使用してa発生した属性名を追跡し、まだ属性名が見つからない場合にのみ現在行を印刷します。属性が見つかるたびに配列がempidリセットされます。

より詳細な説明：

$1=="empid" {delete a}a新しいレコードが開始されるたびに配列が削除されます。
!a[$1]++awk速記表記では、条件付き1ルールの外側の部分は「この行を印刷します」を意味し、0「印刷しない」を意味します。
a[$1]++「発生カウンタ」は、属性名の各値に対して増加し、ここでは「配列インデックス」として扱われます。
評価!a[$1]++は最初配列項目の現在の値がゼロかどうか（つまり、属性がまだ見つかっていないかどうか）を確認し、printtrueの場合（否定演算子のおかげで）操作を実行し、カウンタをインクリメントします。それから（これは、Cスタイルのプログラミング言語でプレフィックス/サフィックスの増加がどのように機能するかと同じです。）したがって、そのプロパティがまだ見つからない場合は印刷されますが、それ以降の発生は無視されます。

ノートこのdelete aステートメントは2012 POSIX標準で許可されている構文に従い、上記はGNUとGNUに適用されますが、awkStéphane Chazelasmawkはnawkこの構文をサポートしない実装について次のように述べました。

delete a

と交換する必要があります

split("",a)

Answer 1

Kusalanandaが正確で、各従業員の記録がlineで始まると仮定すると、empid次のawkコマンドが機能します。

awk -F';' '$1=="empid" {delete a} !a[$1]++' input.txt > output.txt

これは、配列変数を使用してa発生した属性名を追跡し、まだ属性名が見つからない場合にのみ現在行を印刷します。属性が見つかるたびに配列がempidリセットされます。

より詳細な説明：

$1=="empid" {delete a}a新しいレコードが開始されるたびに配列が削除されます。
!a[$1]++awk速記表記では、条件付き1ルールの外側の部分は「この行を印刷します」を意味し、0「印刷しない」を意味します。
a[$1]++「発生カウンタ」は、属性名の各値に対して増加し、ここでは「配列インデックス」として扱われます。
評価!a[$1]++は最初配列項目の現在の値がゼロかどうか（つまり、属性がまだ見つかっていないかどうか）を確認し、printtrueの場合（否定演算子のおかげで）操作を実行し、カウンタをインクリメントします。それから（これは、Cスタイルのプログラミング言語でプレフィックス/サフィックスの増加がどのように機能するかと同じです。）したがって、そのプロパティがまだ見つからない場合は印刷されますが、それ以降の発生は無視されます。

ノートこのdelete aステートメントは2012 POSIX標準で許可されている構文に従い、上記はGNUとGNUに適用されますが、awkStéphane Chazelasmawkはnawkこの構文をサポートしない実装について次のように述べました。

delete a

と交換する必要があります

split("",a)

おすすめ記事