パターンが存在しない限り、ファイルからパターンまで行を削除します。

Question

ファイルが大きすぎてメモリに収まらない場合は、Perlを使用してファイルを読み取ることができます。

perl -0777pe 's/.*?PAT[^\n]*\n?//s' file

PAT希望のモードに変更するだけです。たとえば、次の2つの入力ファイルとスキーマがあるとします5。

$ cat file
1
2
3
4
5
11
12
13
14
15
$ cat file1 
foo
bar
$ perl -0777pe 's/.*?5[^\n]*\n?//s' file
11
12
13
14
15
$ perl -0777pe 's/.*?10[^\n]*\n?//s' file1
foo
bar

説明する

-pe：入力ファイルを1行ずつ読み込み、与えられたスクリプトを-e各行に適用して印刷します。
-0777：ファイル全体をメモリに保存します。
s/.*?PAT[^\n]*\n?//s：最初に表示されるまで、PAT行末まですべてを削除します。

大きなファイルの場合、ファイルを2回読み取ることを避ける方法はありません。それは次のとおりです。

awk -vpat=5 '{
              if(NR==FNR){
                if($0~pat && !a){a++; next} 
                if(a){print}
              }
              else{ 
                if(!a){print}
                else{exit} 
              }
             }' file1 file1

説明する

awk -vpat=5：実行しawkて変数patをに設定します5。
if(NR==FNR){}：最初のファイルの場合。
if($0~pat && !a){a++; next}：行が値と一致し、pat定義されてaいない場合は、a行を追加して次の行に移動します。
if(a){print}：a定義されている場合（ファイルがパターンと一致する場合）、行を印刷します。
else{ }：最初のファイルではない場合（したがって2番目のパスです）。
if(!a){print}定義されていない場合はaファイル全体が必要なため、すべての行が印刷されます。
else{exit}：a定義されている場合は、最初のステップですでに印刷されているため、ファイルを再処理する必要はありません。

Answer 1

ファイルが大きすぎてメモリに収まらない場合は、Perlを使用してファイルを読み取ることができます。

perl -0777pe 's/.*?PAT[^\n]*\n?//s' file

PAT希望のモードに変更するだけです。たとえば、次の2つの入力ファイルとスキーマがあるとします5。

$ cat file
1
2
3
4
5
11
12
13
14
15
$ cat file1 
foo
bar
$ perl -0777pe 's/.*?5[^\n]*\n?//s' file
11
12
13
14
15
$ perl -0777pe 's/.*?10[^\n]*\n?//s' file1
foo
bar

説明する

-pe：入力ファイルを1行ずつ読み込み、与えられたスクリプトを-e各行に適用して印刷します。
-0777：ファイル全体をメモリに保存します。
s/.*?PAT[^\n]*\n?//s：最初に表示されるまで、PAT行末まですべてを削除します。

大きなファイルの場合、ファイルを2回読み取ることを避ける方法はありません。それは次のとおりです。

awk -vpat=5 '{
              if(NR==FNR){
                if($0~pat && !a){a++; next} 
                if(a){print}
              }
              else{ 
                if(!a){print}
                else{exit} 
              }
             }' file1 file1

説明する

awk -vpat=5：実行しawkて変数patをに設定します5。
if(NR==FNR){}：最初のファイルの場合。
if($0~pat && !a){a++; next}：行が値と一致し、pat定義されてaいない場合は、a行を追加して次の行に移動します。
if(a){print}：a定義されている場合（ファイルがパターンと一致する場合）、行を印刷します。
else{ }：最初のファイルではない場合（したがって2番目のパスです）。
if(!a){print}定義されていない場合はaファイル全体が必要なため、すべての行が印刷されます。
else{exit}：a定義されている場合は、最初のステップですでに印刷されているため、ファイルを再処理する必要はありません。

パターンが存在しない限り、ファイルからパターンまで行を削除します。

ベストアンサー1

説明する

説明する

おすすめ記事