awkまたはsedを使用して特定のパターンの部分行を抽出し、新しいフィールドに保存する

Question

これで区切り文字がわかりましたので、区切り記号を分割して再グループ化してください。

sed -Ei 's/(.*gene_name=)([^;]*)(;.*)/\1\2\3\t\2/g' gene

に分かれています。

(.*gene_name=)

gene_name タグまでのすべての文字列は変数 1 に入ります。

([^;]*)

;変数2に入る前のすべての連続文字

(;.*)

文字列の残りの部分は変数3に入ります。

\1\2\3\t\2

タブと追加された遺伝子を使用して文字列を再構築します。

編集する

または@Weijunが言ったように

\0\t\2

他の編集者

コードゴルフ

sed -Ei 's/.*gene_name=([^;]*).*/\0\t\1/g' gene

Answer 1

これで区切り文字がわかりましたので、区切り記号を分割して再グループ化してください。

sed -Ei 's/(.*gene_name=)([^;]*)(;.*)/\1\2\3\t\2/g' gene

に分かれています。

(.*gene_name=)

gene_name タグまでのすべての文字列は変数 1 に入ります。

([^;]*)

;変数2に入る前のすべての連続文字

(;.*)

文字列の残りの部分は変数3に入ります。

\1\2\3\t\2

タブと追加された遺伝子を使用して文字列を再構築します。

編集する

または@Weijunが言ったように

\0\t\2

他の編集者

コードゴルフ

sed -Ei 's/.*gene_name=([^;]*).*/\0\t\1/g' gene

おすすめ記事