ファイルの単一レコードが複数行に分割されます。

ファイルの単一レコードが複数行に分割されます。

Informatica で変換され、Teradata テーブルに保存されたプレーンテキストファイルを使用します。ファイルには14個のフィールド(〜区切り)が含まれています。ただし、レコードが複数行に分散しているため、Informatica はそのレコードを選択できません。

sed / awkまたは他のコマンドを使用して区切り文字を計算してレコードをリンクする方法はありますか?

サンプル記録---

48602040112~4100010080701242015~2010-01-21 10:23:44~Foods~7~Poultry ~Perdue Smart Chicken~Circular~06
-JAN-10~24-JAN-10~$5.99~24 oz., select varieties
up to 4 at this price, additional
Save up to $4.00 
load up on savings~~1598

理想的には、次のようにする必要があります。

48602040112~4100010080701242015~2010-01-21 10:23:44~Foods~7~Poultry ~ Perdue Smart Chicken~Circular~06-JAN-10~24-JAN-10~$5.99~24 oz., select varieties up to 4 at this price, additional Save up to $4.00 load up on savings~~1598

明確でない場合は改行文字が含まれています。

ベストアンサー1

tr -d \\n <infile | tr \~ \\n | paste -d~ - - - - - - - - - - - - - -

動作します。

おすすめ記事