文字列xを文字列zに基づいて文字列yに置き換える

Question

これがすべての極端なケースをカバーしているかどうかはわかりませんが、あなたの例ではあなたが求めていることを行います。

sed '/.*gene_name/{h;s///;s/;.*//;x;};G;s/gene_id[^;]*\(.*\)\n\(.*\)/gene_id\2\1/' file

gene_nameコンテンツがある場合は、抽出して予約済みのスペースに保存し、新しいコンテンツが表示されるgene_idまですべての後続のコンテンツの代替コンテンツとして使用します。gene_name

詳細な詳細：

/.*gene_name/は住所、内部のすべての内容は、対応するパターンが{}ある行にのみ適用されます。
すべてを混乱させる前に、元の行をh古いスペースに保存します。
s///前のパターン（最大gene_name）を削除し、s/;.*//セミコロンで始まるすべての項目を削除します。したがって、残りはスペースと二重引用符で囲まれた文字列だけです。
x2つのスペースを交換すると、予約済みスペースに代替スペースがあり、パターンスペースに元の行があります。
これから、すべての内容はすべての行に適用されます。G予約済みの空白が各行に追加されるため、行、改行文字、および代替文字があります。
s/gene_id[^;]*\(.*\)\n\(.*\)/gene_id\2\1/' is easier to write than to read: [^;]matches everything between遺伝子ID and the（, thus the part to be replaced. The 。）代替parts cover the text before and after the embedded newline, so we can refer to them as\ 1 \ 2 `にあります。and

gene_name<CR>最後の手順を説明するために、埋め込み改行文字としてwithを使用して予約済みスペースを追加した後、バッファがどのように見えるかを見てください。

Chr1_RagTag_p ………; gene_id "XLOC_000060"; exon_number "1";<CR> "AT1G02100"
                          \______v_____/\________v_______/    \____v____/
                   gene_id     [^;]*          \(.*\)       \n    \(.*\)

-E拡張正規表現を使用すると、読みやすくなります（オプション）。

sed -E '/.*gene_name/{h;s///;s/;.*//;x;};G;s/(gene_id)[^;]*(.*)\n(.*)/\1\3\2/' file

gene_nameアップデートは、アップデートの質問のケースがないことを考慮します。

oId私は単にエキスに似ていますgene_nameが、その前にエキスを追加しました。したがって、その後に1つがあるとgene_name上書きされますoId。今回は、より良い読みやすさのために行を区別します。

sed '
  /.*oId/{
    h
    s///
    s/\..*/"/
    x
  }
  /.*gene_name/{
    h
    s///
    s/;.*//
    x
  }
  G
  s/gene_id[^;]*\(.*\)\n\(.*\)/gene_id\2\1/' file

Answer 1