Direct GNU ソートでは、多くのメモリと多くのコアを使用します。

Question

誰も答えなかったので、私はそうしました。

sort -T /mnt/tmp --parallel=14 -S 50G myBigFile.txt

どれが良い値なのか、たぶんスマートなのか確信が持て--batch-sizeず、使っていませんでした。sort

/mnt大容量の一時ディスクにインストールされます（マシンはクラウドの仮想マシンです）。/tmpスペースが十分なディスクであれば省略可能です-T。十分なスペースがあり、非常に高速なディスクであれば使用してください。

私の記憶が正しい場合は、ソートされるファイルのサイズと同じスペースが必要です。デフォルトでは、ファイルを複数のチャンクに分割します。各チャンクはメモリ内で並べ替えて一時ディスクに保存し、次の操作を行います。マージソートで最終出力を生成します。

Answer 1

誰も答えなかったので、私はそうしました。

sort -T /mnt/tmp --parallel=14 -S 50G myBigFile.txt

どれが良い値なのか、たぶんスマートなのか確信が持て--batch-sizeず、使っていませんでした。sort

/mnt大容量の一時ディスクにインストールされます（マシンはクラウドの仮想マシンです）。/tmpスペースが十分なディスクであれば省略可能です-T。十分なスペースがあり、非常に高速なディスクであれば使用してください。

私の記憶が正しい場合は、ソートされるファイルのサイズと同じスペースが必要です。デフォルトでは、ファイルを複数のチャンクに分割します。各チャンクはメモリ内で並べ替えて一時ディスクに保存し、次の操作を行います。マージソートで最終出力を生成します。

おすすめ記事