ファイル数が多く、特定の行をインポートしてから、インポートしたデータをスプレッドシートに入れる必要があります。私のファイルに表示される内容は次のとおりです。
Name: w
Age: x
Height: y
Weight: z
年齢、身長、体重だけが欲しいので、まず以下を実行します。
grep -E 'Age|Height|Weight' [input file] > output.txt
ファイル数が多いので、出力は次のようになります。
Age 1
Height 1
Weight 1
Age 2
Height 2
Weight 2
etc...
今私が望むのは、awkスクリプトを実行して新しいoutput.txtファイルを通過し、最初に「Age」という単語を含む各行を見つけて印刷することです。すべての「年齢」計算が完了すると、身長と体重が計算されます。私はスクリプトを実行しました:
awk -F"\t" '/Age/ {print} /Height/ {print}' output.txt >output2.txt
ただし、元の出力ファイルのように印刷するだけです。すべての年齢が完了したら、キーを見つけるようにどのように変更しますか?
編集する:
私が望む出力はファイルです
1歳
2歳
高さ1
高さ2
重量1
重量2
など..
明確にするために、age1は「age」などを含むfile1の行です。
ベストアンサー1
awkはデフォルトでファイルを一度だけ実行し、すべてのブロックを順番に実行するので、出力が提供されます。以下を使用して目的の動作を取得できます。ソートファイルを一度だけ処理しながら、いつでも行を保存します。
BEGIN {
AgeIndex = 1
HeightIndex = 1
}
/Age/ {
ages[AgeIndex] = $0
AgeIndex+=1
}
/Height/ {
heights[HeightIndex] = $0
HeightIndex+=1
}
END {
for (x = 1; x < AgeIndex; x++)
print ages[x] "\n"
for (x = 1; x < HeightIndex; x++)
print heights[x] "\n"
}
保存しfilter.awk
たら、次を実行します。
awk -f filter.awk output.txt > output2.txt
希望の出力を取得します。
$ awk -f filter.awk < data
Age 1
Age 2
Height 1
Height 2
私たちがやっていることは、2つの配列を作成し、一致するages
各行heights
をその配列に格納することです。AgeIndex
到達した距離を配列として保存します。最後に、保存した各行(必要な追加の改行を含む)を最初にすべての年齢、次にすべての高さで印刷します。
配列はファイル全体をメモリに保存するため、ファイルが特に大きい場合は、ファイル全体を複数回繰り返すのにかかる時間とメモリ使用量をトレードオフする必要があります。この時点では、本質的に他の言語と同じプログラムです。 awkを使用する特別な理由がなければ、他の言語を好むかもしれません。正直なところ、私は提案したいと思います - awkはここではあまり役に立ちません。