Unixでしきい値に基づいてファイルから行を削除する方法は？

Question

あなたの表現は正確ではありません。

a >= b

または（必要に応じて）

!(a < b)

代わりにa!"<b"。

しかし、特定のケースでは、より微妙な問題があります。つまり、数値が倍精度（64ビット）浮動小数点数で表すことができる最小値より小さいということです。

gawk-MGNU MPFR / MPライブラリで構築されたGNU awk（）バージョンがある場合、または--bignumコマンドラインオプションで任意の精度処理を有効にする必要があるかもしれません。

$ gawk -F, -M '$8 >= 2.23E-308' input.file
VARIANT,SNP,chr,pos,A1,A2,BETA,P_value
1:10177_A_AC,rs367896724,1,10177,A,AC,0.000264372,9.3E-01
1:10642_G_A,rs558604819,1,10642,G,A,0.0425225,7.0E-01

そうでない場合、考えられる解決策は、比較する前に数値変換を強制することです。

$ mawk -F, '$8+0 >= 2.23E-308' input.file
1:10177_A_AC,rs367896724,1,10177,A,AC,0.000264372,9.3E-01
1:10642_G_A,rs558604819,1,10642,G,A,0.0425225,7.0E-01

$ awk -F, '$8+0 >= 2.23E-308' input.file
1:10177_A_AC,rs367896724,1,10177,A,AC,0.000264372,9.3E-01
1:10642_G_A,rs558604819,1,10642,G,A,0.0425225,7.0E-01

ただし、これはIEEE二重範囲外の値を強制的に0に設定します（最初は文字列に変換され、文字列の数値はゼロであるため）。

ヘッダー行も必要な場合は、別々の論理テストとして追加してください。

awk -F, 'NR==1 || $8+0 >= 2.23E-308' input.file
VARIANT,SNP,chr,pos,A1,A2,BETA,P_value
1:10177_A_AC,rs367896724,1,10177,A,AC,0.000264372,9.3E-01
1:10642_G_A,rs558604819,1,10642,G,A,0.0425225,7.0E-01

Answer 1