私のデータの最初の数行は次のとおりです。
scaffold10x_1 AUGUSTUS gene 3591 3908 0.61 - . g1
scaffold10x_1 AUGUSTUS transcript 3591 3908 0.61 - . g1.t1
scaffold10x_1 AUGUSTUS stop_codon 3591 3593 . - 0 transcript_id "g1.t1"; gene_id "g1";
scaffold10x_1 AUGUSTUS CDS 3591 3908 0.61 - 0 transcript_id "g1.t1"; gene_id "g1";
scaffold10x_1 AUGUSTUS exon 3591 3908 . - . transcript_id "g1.t1"; gene_id "g1";
scaffold10x_1 AUGUSTUS start_codon 3906 3908 . - 0 transcript_id "g1.t1"; gene_id "g1";
";
最後の列で欠落している行に追加する必要があります。grep -v transcript_id canada.gtf | grep -v "^#"
行方不明を識別することに慣れています。これを行うためにLinuxコマンドを使用できますか?
ベストアンサー1
sed
方法:
sed 's/[^[:space:]]\+[^;[:space:]]$/"&";/' file
出力:
scaffold10x_1 AUGUSTUS gene 3591 3908 0.61 - . "g1";
scaffold10x_1 AUGUSTUS transcript 3591 3908 0.61 - . "g1.t1";
scaffold10x_1 AUGUSTUS stop_codon 3591 3593 . - 0 transcript_id "g1.t1"; gene_id "g1";
scaffold10x_1 AUGUSTUS CDS 3591 3908 0.61 - 0 transcript_id "g1.t1"; gene_id "g1";
scaffold10x_1 AUGUSTUS exon 3591 3908 . - . transcript_id "g1.t1"; gene_id "g1";
scaffold10x_1 AUGUSTUS start_codon 3906 3908 . - 0 transcript_id "g1.t1"; gene_id "g1";