以下のように約4500個のアミノ酸修飾行があります。
S1437T
H1266Y
T2662A
E1397A
E626K
S1538T
E3021K
簡単に言うと、数字の両側の文字はアミノ酸残基であり、数字は残基位置を表す。 2400から3100の範囲の変更のみを検索したいです。
試してみましたがgrep
成功しませんでした。また、この種の作業でより良いことがわかりますが、awk
私はこれについて完全に愚かですawk
。どんな助けでも大変感謝します。
ベストアンサー1
perl
最初の数値シーケンスを抽出した\d+
後、その値を確認します。
$ perl -ne 'print if /\d+/ && $& >= 2400 && $& <= 3100' < your-file
T2662A
E3021K