タグ間で文字列を抽出して新しいテキストファイルに保存する

Question

そしてawk：

awk -F/ '$1=="<<" {i=$2; for(j=3;j<=NF;j++) \
         if($j~/^Contents/) split($j,a,"[()]"); print i " _ " a[2]}' file.txt

フィールド区切り記号をに設定し、/最初のフィールドがある場合は後で印刷できる<<ように2番目のフィールドを変数として保存します。i
残りのフィールドを繰り返し、フィールドがで始まる場合は、Contentsフィールドを分割して()配列を作成しますa。for(j=3;j<=NF;j++) if($j~/^Contents/) split($j,a,"[()]")
変数iと配列の2番目の要素をa分離して印刷します。_

例:

% cat file.txt                                                                                                        
1731 0 obj
<</Page 250/Type/Annot/Subtype/Highlight/Rotate 0/Rect[ 95.4715 347.644 337.068 362.041]/NM(929cd95c-f962-4fa3-b734-2e0e67d7b321)/T(iPad)/CreationDate(D:20160818145053Z00'00')/M(D:20160818145204Z00'00')/C[ 0.454902 0.501961 0.988235]/CA 1/QuadPoints[ 95.4715 362.041 337.068 362.041 95.4715 347.644 337.068 347.644]/Contents(EXAMPLE OF TEXT TO BE EXTRACTED)/F 4/Subj(Highlight)>>
endobj

% awk -F/ '$1=="<<" {i=$2; for(j=3;j<=NF;j++) if($j~/^Contents/) split($j,a,"[()]"); print i " _ " a[2]}' file.txt
Page 250 _ EXAMPLE OF TEXT TO BE EXTRACTED

Answer 1

そしてawk：

awk -F/ '$1=="<<" {i=$2; for(j=3;j<=NF;j++) \
         if($j~/^Contents/) split($j,a,"[()]"); print i " _ " a[2]}' file.txt

フィールド区切り記号をに設定し、/最初のフィールドがある場合は後で印刷できる<<ように2番目のフィールドを変数として保存します。i
残りのフィールドを繰り返し、フィールドがで始まる場合は、Contentsフィールドを分割して()配列を作成しますa。for(j=3;j<=NF;j++) if($j~/^Contents/) split($j,a,"[()]")
変数iと配列の2番目の要素をa分離して印刷します。_

例:

% cat file.txt                                                                                                        
1731 0 obj
<</Page 250/Type/Annot/Subtype/Highlight/Rotate 0/Rect[ 95.4715 347.644 337.068 362.041]/NM(929cd95c-f962-4fa3-b734-2e0e67d7b321)/T(iPad)/CreationDate(D:20160818145053Z00'00')/M(D:20160818145204Z00'00')/C[ 0.454902 0.501961 0.988235]/CA 1/QuadPoints[ 95.4715 362.041 337.068 362.041 95.4715 347.644 337.068 347.644]/Contents(EXAMPLE OF TEXT TO BE EXTRACTED)/F 4/Subj(Highlight)>>
endobj

% awk -F/ '$1=="<<" {i=$2; for(j=3;j<=NF;j++) if($j~/^Contents/) split($j,a,"[()]"); print i " _ " a[2]}' file.txt
Page 250 _ EXAMPLE OF TEXT TO BE EXTRACTED

タグ間で文字列を抽出して新しいテキストファイルに保存する

ベストアンサー1

おすすめ記事