範囲が最大の行を保持

Question

新しい情報を見てここに来ました

awk -F'[ =-]' '{ print $0" "$6-$5 | "sort -k4nr" }' fileA | \
cut -d' ' -f1-3 | \
awk -F'[ =]' '!seen[$3]++'

出力：

>ENST00000366955.7 gene=WASP12 CDS=169-9511
>ENST00000423485.5 gene=PTP2 CDS=160-4752
>ENST00000367142.4 gene=PRPF40B CDS=304-1032

^{これは間違いなく1つのコマンドで行うことができますが、awkまだ使い方を学んでいます。}

最小値が700（例の出力と一致するように）であると仮定すると、次のことを試すことができます。

awk -F'[=-]' '$4-$3 > 700' fileA

出力：

>ENST00000423485.5 gene=PTP2 CDS=160-4752
>ENST00000367142.4 gene=PRPF40B CDS=304-1032
>ENST00000366955.7 gene=WASP12 CDS=169-9511

-F'[=-]'：=とを-列区切り文字として使用して、列3と4になります。

$4-$3 > 700：4番目の列から3番目の列を引いた値が700より大きい行を選択します。

Answer 1

新しい情報を見てここに来ました

awk -F'[ =-]' '{ print $0" "$6-$5 | "sort -k4nr" }' fileA | \
cut -d' ' -f1-3 | \
awk -F'[ =]' '!seen[$3]++'

出力：

>ENST00000366955.7 gene=WASP12 CDS=169-9511
>ENST00000423485.5 gene=PTP2 CDS=160-4752
>ENST00000367142.4 gene=PRPF40B CDS=304-1032

^{これは間違いなく1つのコマンドで行うことができますが、awkまだ使い方を学んでいます。}

最小値が700（例の出力と一致するように）であると仮定すると、次のことを試すことができます。

awk -F'[=-]' '$4-$3 > 700' fileA

出力：

>ENST00000423485.5 gene=PTP2 CDS=160-4752
>ENST00000367142.4 gene=PRPF40B CDS=304-1032
>ENST00000366955.7 gene=WASP12 CDS=169-9511

-F'[=-]'：=とを-列区切り文字として使用して、列3と4になります。

$4-$3 > 700：4番目の列から3番目の列を引いた値が700より大きい行を選択します。

おすすめ記事