特定の連続文字、発生位置、長さの計算

Question

これに非常に便利なawk設定match()とRSTART変数を使用してこれを行うことができます。RLENGTH

<mySequence.fasta awk -v C=N '{
  i=0
  while (match($0, C "+")) {
    printf "Position %d %s %d\n", i+RSTART, C, RLENGTH
    i += RSTART+RLENGTH-1
    $0 = substr($0, RSTART+RLENGTH)
  }}'

またはと配列をperl使用して、試合の開始と終了を記録します。@-@+

perl -ne 'printf "Position %d N %d\n", $-[0]+1, $+[0]-$-[0] while /N+/g'

もう少し高速な別の方法（少なくとも私のバージョンではperl）perlは（実験的）(?{...})正規表現演算子：

perl -ne '0 while /N(?{$s=pos})N*(?{printf "Position %d N %s\n", $s, pos()-$s+1})/g'

Answer 1

これに非常に便利なawk設定match()とRSTART変数を使用してこれを行うことができます。RLENGTH

<mySequence.fasta awk -v C=N '{
  i=0
  while (match($0, C "+")) {
    printf "Position %d %s %d\n", i+RSTART, C, RLENGTH
    i += RSTART+RLENGTH-1
    $0 = substr($0, RSTART+RLENGTH)
  }}'

またはと配列をperl使用して、試合の開始と終了を記録します。@-@+

perl -ne 'printf "Position %d N %d\n", $-[0]+1, $+[0]-$-[0] while /N+/g'

もう少し高速な別の方法（少なくとも私のバージョンではperl）perlは（実験的）(?{...})正規表現演算子：

perl -ne '0 while /N(?{$s=pos})N*(?{printf "Position %d N %s\n", $s, pos()-$s+1})/g'

特定の連続文字、発生位置、長さの計算

ベストアンサー1

おすすめ記事