タブで区切られたファイル列のテキスト文字列から最初の整数を抽出するには？

Question

説明に従って、タブ区切りのファイルを入力とします。例:

$ cat file
1       2       3       4       c.2458C>T       6
a       b       c       d       c.45_46delAA or f
a1      b2      c3      d4      p.Ala78_Arg80del        f6

sedを使う

5番目の列の最初の整数を見つけるには：

$ sed -r 's/([^\t]*\t){4}[^[:digit:]]*([[:digit:]]+).*/\2/' file
2458
45
78

上記はGNUでテストされましたsed。 OSX または他の BSD システムの場合は、以下を試してください。

sed -E 's/([^\t]*\t){4}[^[:digit:]]*([[:digit:]][[:digit:]]*).*/\2/' file

awkを使う

$ awk '{sub(/^[^[:digit:]]*/, "", $5); sub(/[^[:digit:]].*/, "", $5); print $5;}' file
2458
45
78

Answer 1

説明に従って、タブ区切りのファイルを入力とします。例:

$ cat file
1       2       3       4       c.2458C>T       6
a       b       c       d       c.45_46delAA or f
a1      b2      c3      d4      p.Ala78_Arg80del        f6

sedを使う

5番目の列の最初の整数を見つけるには：

$ sed -r 's/([^\t]*\t){4}[^[:digit:]]*([[:digit:]]+).*/\2/' file
2458
45
78

上記はGNUでテストされましたsed。 OSX または他の BSD システムの場合は、以下を試してください。

sed -E 's/([^\t]*\t){4}[^[:digit:]]*([[:digit:]][[:digit:]]*).*/\2/' file

awkを使う

$ awk '{sub(/^[^[:digit:]]*/, "", $5); sub(/[^[:digit:]].*/, "", $5); print $5;}' file
2458
45
78

タブで区切られたファイル列のテキスト文字列から最初の整数を抽出するには？

ベストアンサー1

sedを使う

awkを使う

おすすめ記事