文字列内の部分文字列が繰り返される回数を計算します。

Question

ATG各行の発生回数を返します。

awk -F'ATG' 'NF{print NF-1}' testfile

これは、1 つ以上の行を含むファイルに適用されます。

実施例１

次のテストファイルを検討してください。

$ cat testfile
xxATGxxATG

ATGxxxATGxxx

xxATGxxxxATGxxATGxx

このコードは、ATGの発生回数を正しく計算します。

$ awk -F'ATG' 'NF{print NF-1}' testfile
2
2
3

実施例２

現在のバージョンの質問例を使用すると、次のようになります。

$ cat >file1
ATGTGGATGGTGGGTTACAATGAAGGTGGTGAGTTCAACATGGCTGATTATCCATTCAGTGGAAGGAAACTAAGGCCTCTCATTCCAAGACCAGTCCCAGTCCCTACTACTTCTCCTAACAGCACTTCAACTATAACTCCTTCCTTAAACCGCATTCATGGTGGCAATGATTTATTTTCACAATATCATCACAATCTGCAGCAGCAAGCATCAGTAGGAGATCATAGCAAGAGATCAGAGTTGAATAATAATAATAATCCATCTGCAGCAGTTGTGGTGAGTTCAAGATGGAATCCAACACCAGAACAGTTAAGAGCACTGGAAGAATTGTATAGAAGAGGAACAAGAACACCTTCTGCTGAGCAAATCCAACAAATAACTGCCCAGCTTAGAAAATTTGGAAAAATTGAAGGCAAAAATGTTTTCTATTGGTTTCAGAATCACAAAGCCAGAGAAAGGCAAAAACGACGGCGTCAAATGGAATCAGCAGCTGCTGAGTTTGATTCTGCTATTGAAAAGAAAGACTTAGGCGCAAGTAGG


ACAGTGTTTGAAGTTGAACACACTAAAAACTGGCTACCATCTACAAATTCCAGTACCAGTACTCTTCATCTTGCAGAGGAATCTGTTTCAATTCAAAGGTCAGCAGCAGCAAAAGCAGATGGATGGCTCCAATTCGATGAAGCAGAATTACAGCAAAGAAGAAACTTTATGGAAAGGAATGCCACGTGGCATATGATGCAGTTAACTTCTTCTTGTCCTACAGCTAGCATGTCCACCACAACCACAGTAACAACTAGACTTATGGACCCAAAACTCATCAAGACCCATGAACTCAACTTATTCATTTCACCTCACACATACAAAGAAAGAGAAAACGCTTTTATCCACTTAAATACTAGTAGTACTCATCAAAATGAATCTGATCAAACCCTTCAACTTTTCCCAATAAGGAATGGAGATCATGGATGCACTGATCATCATCATCATCATCATAACATTATCAAAGAGACACAGATATCAGCTTCAGCAATCAATGCACCCAACCAGTTTATTGAGTTTCTTCCCTTGAAAAACTGA

その結果は次のとおりです。

$ awk -F'ATG' 'NF{print NF-1}' file1
9
15

どのように動作しますか？

awk はファイルの各行を暗黙的に繰り返します。各行はフィールドで区切られます。

-F'ATG'

これは awk にATGフィールド区切り文字として使用するように指示します。
NF{print NF-1}

これは awk に空でない行ごとにフィールド数から 1 を引いた値を出力するように指示します。

（空白行のフィールド数NFは0です。したがって、これらの行の条件はNFfalseと評価され、効果的にスキップされます。）

Answer 1

ATG各行の発生回数を返します。

awk -F'ATG' 'NF{print NF-1}' testfile

これは、1 つ以上の行を含むファイルに適用されます。

実施例１

次のテストファイルを検討してください。

$ cat testfile
xxATGxxATG

ATGxxxATGxxx

xxATGxxxxATGxxATGxx

このコードは、ATGの発生回数を正しく計算します。

$ awk -F'ATG' 'NF{print NF-1}' testfile
2
2
3

実施例２

現在のバージョンの質問例を使用すると、次のようになります。

$ cat >file1
ATGTGGATGGTGGGTTACAATGAAGGTGGTGAGTTCAACATGGCTGATTATCCATTCAGTGGAAGGAAACTAAGGCCTCTCATTCCAAGACCAGTCCCAGTCCCTACTACTTCTCCTAACAGCACTTCAACTATAACTCCTTCCTTAAACCGCATTCATGGTGGCAATGATTTATTTTCACAATATCATCACAATCTGCAGCAGCAAGCATCAGTAGGAGATCATAGCAAGAGATCAGAGTTGAATAATAATAATAATCCATCTGCAGCAGTTGTGGTGAGTTCAAGATGGAATCCAACACCAGAACAGTTAAGAGCACTGGAAGAATTGTATAGAAGAGGAACAAGAACACCTTCTGCTGAGCAAATCCAACAAATAACTGCCCAGCTTAGAAAATTTGGAAAAATTGAAGGCAAAAATGTTTTCTATTGGTTTCAGAATCACAAAGCCAGAGAAAGGCAAAAACGACGGCGTCAAATGGAATCAGCAGCTGCTGAGTTTGATTCTGCTATTGAAAAGAAAGACTTAGGCGCAAGTAGG


ACAGTGTTTGAAGTTGAACACACTAAAAACTGGCTACCATCTACAAATTCCAGTACCAGTACTCTTCATCTTGCAGAGGAATCTGTTTCAATTCAAAGGTCAGCAGCAGCAAAAGCAGATGGATGGCTCCAATTCGATGAAGCAGAATTACAGCAAAGAAGAAACTTTATGGAAAGGAATGCCACGTGGCATATGATGCAGTTAACTTCTTCTTGTCCTACAGCTAGCATGTCCACCACAACCACAGTAACAACTAGACTTATGGACCCAAAACTCATCAAGACCCATGAACTCAACTTATTCATTTCACCTCACACATACAAAGAAAGAGAAAACGCTTTTATCCACTTAAATACTAGTAGTACTCATCAAAATGAATCTGATCAAACCCTTCAACTTTTCCCAATAAGGAATGGAGATCATGGATGCACTGATCATCATCATCATCATCATAACATTATCAAAGAGACACAGATATCAGCTTCAGCAATCAATGCACCCAACCAGTTTATTGAGTTTCTTCCCTTGAAAAACTGA

その結果は次のとおりです。

$ awk -F'ATG' 'NF{print NF-1}' file1
9
15

どのように動作しますか？

awk はファイルの各行を暗黙的に繰り返します。各行はフィールドで区切られます。

-F'ATG'

これは awk にATGフィールド区切り文字として使用するように指示します。
NF{print NF-1}

これは awk に空でない行ごとにフィールド数から 1 を引いた値を出力するように指示します。

（空白行のフィールド数NFは0です。したがって、これらの行の条件はNFfalseと評価され、効果的にスキップされます。）

文字列内の部分文字列が繰り返される回数を計算します。

ベストアンサー1

実施例１

実施例２

どのように動作しますか？

おすすめ記事