リストに文字列があることを確認し、文字列がある場合は3番目のファイルを出力します。

Question

これはawkを使って直接表現できます。

awk 'FNR==NR { h[$1]; next } { for(i=2; i<=NF; i++) $i = ($i in h)? 1 : 0 } 1' mylist.tab data.tab

またはより読みやすい形式で：

解析.awk

# Collect mylist.tab into the `h` associative array
FNR==NR {
  h[$1]
  next
}

# For all but the first column in data.tab check and record if it is in `h`
{ 
  for(i=2; i<=NF; i++) 
    $i = ($i in h) ? 1 : 0 
}

# Short for { print $0 }
1

次のように実行します。

awk -f parse.awk mylist.tab data.tab

出力：

Info_1 0 1 1
Info_2 1 0
Info_3 1
Info_4 1 0 0 0 1
Info_5

またはタブで区切られた列の場合：

awk -v OFS='\t' -f parse.awk mylist.tab data.tab

出力：

Info_1  0   1   1
Info_2  1   0
Info_3  1
Info_4  1   0   0   0   1
Info_5

Answer 1

これはawkを使って直接表現できます。

awk 'FNR==NR { h[$1]; next } { for(i=2; i<=NF; i++) $i = ($i in h)? 1 : 0 } 1' mylist.tab data.tab

またはより読みやすい形式で：

解析.awk

# Collect mylist.tab into the `h` associative array
FNR==NR {
  h[$1]
  next
}

# For all but the first column in data.tab check and record if it is in `h`
{ 
  for(i=2; i<=NF; i++) 
    $i = ($i in h) ? 1 : 0 
}

# Short for { print $0 }
1

次のように実行します。

awk -f parse.awk mylist.tab data.tab

出力：

Info_1 0 1 1
Info_2 1 0
Info_3 1
Info_4 1 0 0 0 1
Info_5

またはタブで区切られた列の場合：

awk -v OFS='\t' -f parse.awk mylist.tab data.tab

出力：

Info_1  0   1   1
Info_2  1   0
Info_3  1
Info_4  1   0   0   0   1
Info_5

リストに文字列があることを確認し、文字列がある場合は3番目のファイルを出力します。

ベストアンサー1

おすすめ記事