ビッグデータ分析のために何千ものファイルを繰り返していますか？

Question

codem1プロセスの出力（それは何でも）を見ると、ファイルが見つからないことがわかりますOG0018055。これはファイルが実際に呼び出されるので論理的です。OG0018055.fa

スクリプトから.faファイル名行の拡張子を削除できます。

gene_name="${filename%%.*}"

遺伝子名を学びましょう。その後、sedファイルテンプレートのすべてのパターン発生を適切な遺伝子名に置き換えることができます。GENEただし、これは更新されたcodeml_0.ctlファイル内の行がseqfile次のようになることを意味します。

seqfile = ../pamlfiles/OG0018055

したがって、.faここに拡張はありません。

したがって、テンプレートファイルを修正して読んでください。

seqfile = ../pamlfiles/GENE.fa

これにより、.faファイル拡張子が失われることはありません。

Answer 1