タブ区切りファイルのカンマ区切りリストを別々の行に展開します。

Question

この awk コマンドは非常に読みやすいです。

awk '
  BEGIN {FS = "[,\t]"; OFS = "\t"}
  {for (i=3; i<=NF; i++) print $1, $2, $i}
' file

Perlでは、次のようになります。

perl -F'[,\t]' -lane 'print join "\t", @F[0,1], $F[$_] for 2..$#F' file
# or
perl -F'[,\t]' -slane 'print @F[0,1], $F[$_] for 2..$#F' -- -,=$'\t' file

実際のタブ文字があるかどうかわからない場合：

奇妙な：FS = ",|[[:blank:]]+"
真珠：-F',|\s+'

楽しみとしてbash

while IFS= read -r line; do
    prefix=${line%%GO:*}
    IFS=, read -ra gos <<< "${line#$prefix}"
    for go in "${gos[@]}"; do echo "$prefix$go"; done
done < file

このバージョンはスペースやタブを気にしませんが、たくさんPerlやawkより遅いです。

Answer 1

この awk コマンドは非常に読みやすいです。

awk '
  BEGIN {FS = "[,\t]"; OFS = "\t"}
  {for (i=3; i<=NF; i++) print $1, $2, $i}
' file

Perlでは、次のようになります。

perl -F'[,\t]' -lane 'print join "\t", @F[0,1], $F[$_] for 2..$#F' file
# or
perl -F'[,\t]' -slane 'print @F[0,1], $F[$_] for 2..$#F' -- -,=$'\t' file

実際のタブ文字があるかどうかわからない場合：

奇妙な：FS = ",|[[:blank:]]+"
真珠：-F',|\s+'

楽しみとしてbash

while IFS= read -r line; do
    prefix=${line%%GO:*}
    IFS=, read -ra gos <<< "${line#$prefix}"
    for go in "${gos[@]}"; do echo "$prefix$go"; done
done < file

このバージョンはスペースやタブを気にしませんが、たくさんPerlやawkより遅いです。

タブ区切りファイルのカンマ区切りリストを別々の行に展開します。

ベストアンサー1

おすすめ記事