ビッグデータを処理するためにバッチモードでプログラムを実行するには？

Question

関数を定義するか、1つの引数のみを取るスクリプトを作成します。.pamlcodemlファイルまたは名前に一意の番号があり、ラッパーを構成して呼び出されます。.ctlパラメータファイルによってはテンプレートが変更されません。codeml.ctl文書：

function mycodeml(){
  num="${1//[^0-9]/}" # keep only numbers
  if [ !-f OG$num.paml ] ;then
    echo ERR NOTFOUND $PWD/OG$num.paml >&2
  else
    tmp=$(mktemp /tmp/codeml_XXX.ctl)
    sed "s/OG[0-9]*\(.paml\|.treefile\|_out.paml\)/OG$num\1/g" codeml.ctl >$tmp &&
    codeml $tmp
    rm $tmp
  fi
}

だからあなたは実行することができますmycodeml OGxxx.paml

複数のアイテムを一度にバッチ処理するには、そのアイテムを使用して収集し、ls次grepの場所に挿入しますxargs。

ls | grep 'OG[0-9]*.paml' | xargs -l1 mycodeml

または並列化：

ls | grep 'OG[0-9]*.paml' | parallel mycodeml

Answer 1

関数を定義するか、1つの引数のみを取るスクリプトを作成します。.pamlcodemlファイルまたは名前に一意の番号があり、ラッパーを構成して呼び出されます。.ctlパラメータファイルによってはテンプレートが変更されません。codeml.ctl文書：

function mycodeml(){
  num="${1//[^0-9]/}" # keep only numbers
  if [ !-f OG$num.paml ] ;then
    echo ERR NOTFOUND $PWD/OG$num.paml >&2
  else
    tmp=$(mktemp /tmp/codeml_XXX.ctl)
    sed "s/OG[0-9]*\(.paml\|.treefile\|_out.paml\)/OG$num\1/g" codeml.ctl >$tmp &&
    codeml $tmp
    rm $tmp
  fi
}

だからあなたは実行することができますmycodeml OGxxx.paml

複数のアイテムを一度にバッチ処理するには、そのアイテムを使用して収集し、ls次grepの場所に挿入しますxargs。

ls | grep 'OG[0-9]*.paml' | xargs -l1 mycodeml

または並列化：

ls | grep 'OG[0-9]*.paml' | parallel mycodeml

ビッグデータを処理するためにバッチモードでプログラムを実行するには？

バッチモードで

ベストアンサー1

おすすめ記事