私はUnixに初めて触れたので、ここで私の問題に対する解決策を探しています。開始するコードがありません。 :) 問題と必要な解決策だけが必要です。
次のプロセスを自動化したいです(例:ExcelからVlookup機能をコピー)。
- システムは、さまざまな数の列と区切り文字を使用して複数のCSVファイルを生成します。
生成されたすべてのファイルにはキー(トランザクション番号)が含まれています。このキーは、異なる文書間の異なる列に存在できます。
編集:抜粋は取引番号でソートされていないと仮定します。
たとえば、表1は次のとおりです。
field1,field2,field3,Transaction#,field4
ABC,ABC,ABC,1,CFG
ABC,ABC,ABC,2,CFG
ABC,ABC,ABC,3,CFG
たとえば、表2:
field1;Transaction#;field3;field4;field5
ABC;1;ABC;ABC;CFG
ABC;2;ABC;ABC;CFG
ABC;3;ABC;ABC;CFG
次のルックアップテーブルがあります。
Transaction# New# 1 122 2 123 3 124
各csvテーブルの末尾にNew#というタイトルの列を追加する必要があります。
編集:ルックアップテーブル内のすべてのトランザクションが入力テーブルに存在せず、入力テーブル内のすべてのトランザクションがルックアップテーブルに存在しないと仮定します。
たとえば、表1は次のとおりです。
field1,field2,field3,Transaction#,field4,new#
ABC,ABC,ABC,1,CFG,122
ABC,ABC,ABC,2,CFG,123
ABC,ABC,ABC,3,CFG,124
たとえば、表2:
field1;Transaction#;field3;field4;field5;new#
ABC;1;ABC;ABC;CFG;122
ABC;2;ABC;ABC;CFG;123
ABC;3;ABC;ABC;CFG;124
ベストアンサー1
あなたのテーブルとルックアップファイルは両方ともCSVであり、同じ区切り文字を持ち、同じ参照規則を使用すると仮定します。そうでない場合は、まず他の手段で標準化する必要があります。
また、ルックアップファイルがメモリから読み取れるのに十分小さいと仮定します。そうでない場合は、データをSQLに変換する必要があります。
これらの仮定により、以下を使用できますawk
。
awk -F , -v OFS=, -v col=4 '
NR == 1 { next }
NR == FNR {
n[$1] = $2
}
NR != FNR {
NF++
$NF = FNR == 1 ? "new" : n[$col]
print
}' lookup.csv Table1.csv
-F
、OFS
およびcol
上記の項目を調整して、表のCSV区切り記号と関連列に一致させることができます。