ノート

Question

優雅さは正しい正規表現から来ることができます。すべての行終端文字を目的の区切り文字\r（\n）に変更する代わりに（GNU sedではこれを理解するsed実装はほとんどありませんが、すべてのsed実装が理解しているわけではありません）：s/\r/\n/g\r\n\r\n\r-E

sed -E 's/\r\n|\r|\n/; /g'

または空白行を削除するには走るこれらの行終端は次のとおりです。

sed -E 's/[\r\n]+/; /g'

パターン空間ですべてのラインターミネータをキャプチャできる場合は機能します。これは、ファイル全体を編集できるようにメモリに保存することを意味します。

したがって、より簡単な方法を使用できます（GNU sedの1つのコマンド）。

sed -zE 's/[\r\n]+/; /g; s/; $/\n/' "$filepathvar"

-zヌルバイトを行終端として使用して、\rパターン空間のすべての合計を効果的に取得します。\n

すべての種類の行区切り文字をs/[\r\n]+/; /g目的の文字列に変換します。

（最後）末尾の区切り文字を s/; $/\n/実際の改行文字に変換します。

ノート

sedオプションは、-zゼロ区切り文字（0x00）を使用することを意味します。この区切り文字は、findがxargs（）オプションと一致する改行-print0（）でファイル名を処理できる必要があるために使用されます。-0これは、一部のツールがゼロで区切られた文字列を処理するように変更されたことを意味します。

これは、改行の代わりに0からファイルを分割する非posixオプションです。

Posixテキストファイルには0（NIL）バイトを含めないでください。このオプションを使用すると、処理する前にファイル全体をメモリにキャプチャすることを意味します。

NILからファイルを削除すると、sedのパターンスペースで改行文字を編集できます。ファイルにNILバイトがある場合、ファイル内のすべてのブロックで編集を続けることができるため、改行のアイデアはまだ有効です。

この-zオプションはGNU sedに追加されました。 ATT sed（posixベース）にはそのようなオプションがなく（まだありません）、一部のBSD sedもまだありません。

このオプションの代替案は、-zファイル全体をメモリにキャプチャすることです。これは次の方法で行うことができます。

sed 'H;1h;$!d'          # capture whole file in hold space.
sed ':a;N;$!ba'         # capture whole file in pattern space.

パターンスペースにすべての改行（最後の行を除く）を配置すると編集可能になります。

sed -Ee 'H;1h;$!d;x'   -e 's/(\r\n|\r|\n)/; /g

また、古いsedにはより長くより明示的なsedを使用する必要があり(\r\n|\r|\n)+ます。[\r\n]+\r\n[]

ラインガイド

一度に 1 行ずつ実行するソリューション ( \ra は、このソリューションで有効な行終端者でもある)。これは、GNU awk を使用してファイル全体をメモリに保持する必要がないことを意味します（使用されるメモリが少ない）。

awk -vRS='[\r\n]+' 'NR>1{printf "; "}{printf $0}END{print ""}'  file

正規表現レコード区切り文字のため、GNU awkでなければなりません[\r\n]+。他のawkでは、レコード区切り文字はシングルバイトでなければなりません。

Answer 1

優雅さは正しい正規表現から来ることができます。すべての行終端文字を目的の区切り文字\r（\n）に変更する代わりに（GNU sedではこれを理解するsed実装はほとんどありませんが、すべてのsed実装が理解しているわけではありません）：s/\r/\n/g\r\n\r\n\r-E

sed -E 's/\r\n|\r|\n/; /g'

または空白行を削除するには走るこれらの行終端は次のとおりです。

sed -E 's/[\r\n]+/; /g'

パターン空間ですべてのラインターミネータをキャプチャできる場合は機能します。これは、ファイル全体を編集できるようにメモリに保存することを意味します。

したがって、より簡単な方法を使用できます（GNU sedの1つのコマンド）。

sed -zE 's/[\r\n]+/; /g; s/; $/\n/' "$filepathvar"

-zヌルバイトを行終端として使用して、\rパターン空間のすべての合計を効果的に取得します。\n

すべての種類の行区切り文字をs/[\r\n]+/; /g目的の文字列に変換します。

（最後）末尾の区切り文字を s/; $/\n/実際の改行文字に変換します。

ノート

sedオプションは、-zゼロ区切り文字（0x00）を使用することを意味します。この区切り文字は、findがxargs（）オプションと一致する改行-print0（）でファイル名を処理できる必要があるために使用されます。-0これは、一部のツールがゼロで区切られた文字列を処理するように変更されたことを意味します。

これは、改行の代わりに0からファイルを分割する非posixオプションです。

Posixテキストファイルには0（NIL）バイトを含めないでください。このオプションを使用すると、処理する前にファイル全体をメモリにキャプチャすることを意味します。

NILからファイルを削除すると、sedのパターンスペースで改行文字を編集できます。ファイルにNILバイトがある場合、ファイル内のすべてのブロックで編集を続けることができるため、改行のアイデアはまだ有効です。

この-zオプションはGNU sedに追加されました。 ATT sed（posixベース）にはそのようなオプションがなく（まだありません）、一部のBSD sedもまだありません。

このオプションの代替案は、-zファイル全体をメモリにキャプチャすることです。これは次の方法で行うことができます。

sed 'H;1h;$!d'          # capture whole file in hold space.
sed ':a;N;$!ba'         # capture whole file in pattern space.

パターンスペースにすべての改行（最後の行を除く）を配置すると編集可能になります。

sed -Ee 'H;1h;$!d;x'   -e 's/(\r\n|\r|\n)/; /g

また、古いsedにはより長くより明示的なsedを使用する必要があり(\r\n|\r|\n)+ます。[\r\n]+\r\n[]

ラインガイド

一度に 1 行ずつ実行するソリューション ( \ra は、このソリューションで有効な行終端者でもある)。これは、GNU awk を使用してファイル全体をメモリに保持する必要がないことを意味します（使用されるメモリが少ない）。

awk -vRS='[\r\n]+' 'NR>1{printf "; "}{printf $0}END{print ""}'  file

正規表現レコード区切り文字のため、GNU awkでなければなりません[\r\n]+。他のawkでは、レコード区切り文字はシングルバイトでなければなりません。

ノート

ベストアンサー1

ノート

ラインガイド

おすすめ記事