ベストアンサー1
次の1行を試してください。
cut -f4 in.tsv | tail -n +2 | grep -P '\S'
詳細::
cut -f4 in.tsv
入力ファイルのタブで区切られた4番目の列を出力しますin.tsv
。
tail -n +2
:最初の行(タイトル)を削除します。
grep -P '\S'
:空白以外の文字を含む行のみを保持します。つまり、空行を削除します。 Perl正規表現を使用するように -P
教えてください。grep
一意の遺伝子名だけが必要な場合は、sort -u
次のように追加してください。
cut -f4 in.tsv | tail -n +2 | grep -P '\S' | sort -u