400GBのバイナリファイルをgrepする最速の方法は何ですか? HDDダンプでtxtファイルが必要で、そのファイルの一部の文字列を知っていて、ダンプでファイルを探したいと思います。
私は試してみましたが、grep -a -C 10 searchstring
grepが改行なしで大きなデータの塊を読み取ろうとすると、メモリ不足が原因でクラッシュします。そして、最初から検索を開始するのではなく、ファイルの特定のポイントから検索を開始すると思いました。
ベストアンサー1
私はこれをこのように使用しますstrings
:
strings 400Gfile.bin | grep -C 10 searchstring
与えられたオフセット(例えば20G)から始めるには、
dd if=400Gfile.bin bs=20G skip=1 | strings | grep -C 10 searchstring