Informatica で変換され、Teradata テーブルに保存されたプレーンテキストファイルを使用します。ファイルには14個のフィールド(〜区切り)が含まれています。ただし、レコードが複数行に分散しているため、Informatica はそのレコードを選択できません。
sed / awkまたは他のコマンドを使用して区切り文字を計算してレコードをリンクする方法はありますか?
サンプル記録---
48602040112~4100010080701242015~2010-01-21 10:23:44~Foods~7~Poultry ~Perdue Smart Chicken~Circular~06
-JAN-10~24-JAN-10~$5.99~24 oz., select varieties
up to 4 at this price, additional
Save up to $4.00
load up on savings~~1598
理想的には、次のようにする必要があります。
48602040112~4100010080701242015~2010-01-21 10:23:44~Foods~7~Poultry ~ Perdue Smart Chicken~Circular~06-JAN-10~24-JAN-10~$5.99~24 oz., select varieties up to 4 at this price, additional Save up to $4.00 load up on savings~~1598
明確でない場合は改行文字が含まれています。
ベストアンサー1
tr -d \\n <infile | tr \~ \\n | paste -d~ - - - - - - - - - - - - - -
動作します。