巨大なファイルから多数のパターンをGrepします。

Question

もちろん、問題は大きなファイルに対してgrepを10,000回実行することです。両方のファイルを一度だけ読み取る必要があります。スクリプト言語を使用したくない場合は、次のようにします。

ファイル1からすべての数値を抽出してソートします。
ファイル2からすべての数値を抽出してソートします。
comm2番目のリストの内容だけを取得するには、ソートされたリストを実行してください。

このような：

$ grep -o '^[0-9]\{12\}$' file1 | sort -u -o file1.sorted
$ grep -o  '[0-9]\{12\}'  file2 | sort -u -o file2.sorted
$ comm -13 file1.sorted file2.sorted > file3

望むよりman comm。

ログファイルなどの大容量ファイルを毎日切り捨てることができる場合は、ソートされた数のキャッシュを保持でき、毎回解析する必要はありません。

Answer 1

もちろん、問題は大きなファイルに対してgrepを10,000回実行することです。両方のファイルを一度だけ読み取る必要があります。スクリプト言語を使用したくない場合は、次のようにします。

ファイル1からすべての数値を抽出してソートします。
ファイル2からすべての数値を抽出してソートします。
comm2番目のリストの内容だけを取得するには、ソートされたリストを実行してください。

このような：

$ grep -o '^[0-9]\{12\}$' file1 | sort -u -o file1.sorted
$ grep -o  '[0-9]\{12\}'  file2 | sort -u -o file2.sorted
$ comm -13 file1.sorted file2.sorted > file3

望むよりman comm。

ログファイルなどの大容量ファイルを毎日切り捨てることができる場合は、ソートされた数のキャッシュを保持でき、毎回解析する必要はありません。

巨大なファイルから多数のパターンをGrepします。

ベストアンサー1

おすすめ記事