GNUを使用して非常に長い行を並列に処理する

Question

--pipe（または）を使用する必要があります--pipepart。ディスク速度が速い場合：

parallel -a bigdumpfile.sql --pipe-part --block 100M -k -q sed 's/table1/newtable/' | sql ...

速度が遅い場合：

parallel -j1 -a bigdumpfile.sql --pipe-part --block 100M -k -q sed 's/table1/newtable/' | sql ...

-jディスクに最適なオプションを見つけるには調整してください。

複数の挿入を並列に実行するには、次のようにします。

# Create the table
head -n 40 bigdumpfile.sql | sql ...
# do the INSERTs in parallel
do_ins() {
  grep 'INSERT INTO' |
    sed s/table1/newtable/ |
    sql ...
}
export -f do_ins
parallel -a bigdumpfile.sql --pipe-part --block -1 do_ins

しかし、Stéphane Chazelasが提案したように、これを行う方が速いかもしれません。

sed s/table1/newtable/ bigdumpfile.sql | sql some-database

Answer 1

--pipe（または）を使用する必要があります--pipepart。ディスク速度が速い場合：

parallel -a bigdumpfile.sql --pipe-part --block 100M -k -q sed 's/table1/newtable/' | sql ...

速度が遅い場合：

parallel -j1 -a bigdumpfile.sql --pipe-part --block 100M -k -q sed 's/table1/newtable/' | sql ...

-jディスクに最適なオプションを見つけるには調整してください。

複数の挿入を並列に実行するには、次のようにします。

# Create the table
head -n 40 bigdumpfile.sql | sql ...
# do the INSERTs in parallel
do_ins() {
  grep 'INSERT INTO' |
    sed s/table1/newtable/ |
    sql ...
}
export -f do_ins
parallel -a bigdumpfile.sql --pipe-part --block -1 do_ins

しかし、Stéphane Chazelasが提案したように、これを行う方が速いかもしれません。

sed s/table1/newtable/ bigdumpfile.sql | sql some-database

GNUを使用して非常に長い行を並列に処理する

ベストアンサー1

おすすめ記事