評価しきい値が 1e-3 の SwissProt データベースに対して BlastX を実行しました。
出力は次のとおりです。
>TCONS_00006082 sp|P43298|TMK1_ARATH 57.89 57 23 2 459 292 751 806 8e-11 67.4
>TCONS_00006082 sp|P0DH62|Y4407_SELML 69.05 42 12 1 435 313 373 414 1e-08 60.1
>TCONS_00006082 sp|Q8RWZ5|SD25_ARATH 56.52 46 19 1 435 301 659 704 1e-08 60.1
>TCONS_00006082 sp|Q8VYA3|WAKLJ_ARATH 41.43 70 40 1 477 271 586 655 5e-08 58.2
>TCONS_00006082 sp|Q9C9L5|WAKLH_ARATH 40.00 70 41 1 477 271 600 669 5e-08 58.2
>TCONS_00006082 sp|P93749|Y2197_ARATH 40.54 74 43 2 501 283 225 297 6e-08 57.8
>TCONS_00006082 sp|Q9M342|WAKLP_ARATH 34.52 84 54 2 519 271 504 580 6e-08 57.8
これで、e値(フィールド11)> 0.001でこれらのIDをフィルタリングしたいと思います。どうすればいいですか?
ベストアンサー1
簡単に使用できますawk
。 11番目のフィールドが必要な値のようです。
awk '$11>0.001{print $0}' file
awk
ステートメントが正しい場合、科学的表記が理解され、行全体が印刷されます。
気づく:質問出力に> 0.001基準を満たす行がないため、行は印刷されません。代わりに、次のようにテストできます。
awk '$11>0.00000001{print $0}' file
4行を印刷する必要があります。