sed コマンドは、パターンに続く行の単語を置き換えるために使用されます。

Question

私はあなたの例が良くないと思います。実際には、次のファイルを使用してプログラムに変換するのではなく、遺伝子IDを遺伝子名にマップする必要があります。

$ cat ids2names
gene_A when
gene_B chapmen
gene_C billies

その場合は、awkを使用して次のことができます。

$ awk -F'[: ]' 'NR==FNR{map[$1]=$2; next} {print map[$1], $3}' ids2names file
when CTCTTTCTTTTACGCCT
when CTCTTTCTTTTACGCCT
when CTCTTTCTTTTACGCCT
chapmen CTCTTTCTTTTACGCCT
chapmen CTCTTTCTTTTACGCCT
billies CTCTTTCTTTTACGCCT

そうではなく、遺伝子名が実際に_削除された例のように遺伝子IDである場合...

すべてのsedを使用してください：

$ sed 's/_\([^:]*\)[^ ]*/\1/' file
geneA CTCTTTCTTTTACGCCT
geneA CTCTTTCTTTTACGCCT
geneA CTCTTTCTTTTACGCCT
geneB CTCTTTCTTTTACGCCT
geneB CTCTTTCTTTTACGCCT
geneC CTCTTTCTTTTACGCCT

または任意の奇妙な：

$ awk -F'[_: ]' '{print $1 $2, $4}' file
geneA CTCTTTCTTTTACGCCT
geneA CTCTTTCTTTTACGCCT
geneA CTCTTTCTTTTACGCCT
geneB CTCTTTCTTTTACGCCT
geneB CTCTTTCTTTTACGCCT
geneC CTCTTTCTTTTACGCCT

入力の空白が常に単一の空白でない場合は、-F'[: ]'awkスクリプトのOR -F'[:[:blank:]]+'（存在する場合はそのままにしてください）とsedスクリプトのORに変更します。-F'[: \t]+'_[^ ][^[:blank:]][^ \t]

ダンチャメンベルギー

Answer 1