CSVファイルの列から改行を削除する

Question

CSVがExcelなどのMSツールで作成された場合、以下のようにフィールド中央の「改行文字」はLF、各レコードの末尾にある「改行文字」はCRLFです（「フィールドの末尾のLFに改行」$と入力し、レコードCRLFと入力します。^M$

$ cat -Ev file
ID,Code,Message,date^M$
1244,,"""Exception error : java connection error$
:8080 Connection refused""",01-09-2021^M$

その場合は、レコードがCRLFで終わり、中間レコードLFを空白に置き換えるようにGNU awk（マルチキャラクタRSの場合）に通知できます。

$ awk -v RS='\r\n' '{gsub(/\n/," ")} 1' file
ID,Code,Message,date
1244,,"""Exception error : java connection error :8080 Connection refused""",01-09-2021

POSIX awkのみがあり、CSV用のツールがない場合は、次を参照してください。awkを使用してCSVを効率的に解析する最も強力な方法は何ですかこれを行うには、CRがファイル内の他の場所に表示されない場合は、awkを使用してこれを行うことができます。

$ awk -v RS='\r' 'NR>1{print prev} {sub(/^\n/,""); gsub(/\n/," "); prev=$0}' file
ID,Code,Message,date
1244,,"""Exception error : java connection error :8080 Connection refused""",01-09-2021

Answer 1

CSVがExcelなどのMSツールで作成された場合、以下のようにフィールド中央の「改行文字」はLF、各レコードの末尾にある「改行文字」はCRLFです（「フィールドの末尾のLFに改行」$と入力し、レコードCRLFと入力します。^M$

$ cat -Ev file
ID,Code,Message,date^M$
1244,,"""Exception error : java connection error$
:8080 Connection refused""",01-09-2021^M$

その場合は、レコードがCRLFで終わり、中間レコードLFを空白に置き換えるようにGNU awk（マルチキャラクタRSの場合）に通知できます。

$ awk -v RS='\r\n' '{gsub(/\n/," ")} 1' file
ID,Code,Message,date
1244,,"""Exception error : java connection error :8080 Connection refused""",01-09-2021

POSIX awkのみがあり、CSV用のツールがない場合は、次を参照してください。awkを使用してCSVを効率的に解析する最も強力な方法は何ですかこれを行うには、CRがファイル内の他の場所に表示されない場合は、awkを使用してこれを行うことができます。

$ awk -v RS='\r' 'NR>1{print prev} {sub(/^\n/,""); gsub(/\n/," "); prev=$0}' file
ID,Code,Message,date
1244,,"""Exception error : java connection error :8080 Connection refused""",01-09-2021

CSVファイルの列から改行を削除する

ベストアンサー1

おすすめ記事