e値に対してフィルタリングされた爆発出力

e値に対してフィルタリングされた爆発出力

評価しきい値が 1e-3 の SwissProt データベースに対して BlastX を実行しました。

出力は次のとおりです。

>TCONS_00006082    sp|P43298|TMK1_ARATH    57.89    57    23    2    459    292    751    806    8e-11    67.4
>TCONS_00006082    sp|P0DH62|Y4407_SELML    69.05    42    12    1    435    313    373    414    1e-08    60.1
>TCONS_00006082    sp|Q8RWZ5|SD25_ARATH    56.52    46    19    1    435    301    659    704    1e-08    60.1
>TCONS_00006082    sp|Q8VYA3|WAKLJ_ARATH    41.43    70    40    1    477    271    586    655    5e-08    58.2
>TCONS_00006082    sp|Q9C9L5|WAKLH_ARATH    40.00    70    41    1    477    271    600    669    5e-08    58.2
>TCONS_00006082    sp|P93749|Y2197_ARATH    40.54    74    43    2    501    283    225    297    6e-08    57.8
>TCONS_00006082    sp|Q9M342|WAKLP_ARATH    34.52    84    54    2    519    271    504    580    6e-08    57.8

これで、e値(フィールド11)> 0.001でこれらのIDをフィルタリングしたいと思います。どうすればいいですか?

ベストアンサー1

簡単に使用できますawk。 11番目のフィールドが必要な値のようです。

awk '$11>0.001{print $0}' file

awkステートメントが正しい場合、科学的表記が理解され、行全体が印刷されます。

気づく:質問出力に> 0.001基準を満たす行がないため、行は印刷されません。代わりに、次のようにテストできます。

awk '$11>0.00000001{print $0}' file

4行を印刷する必要があります。

おすすめ記事