Amazon S3 バケットのサブフォルダにある多数の .gz ファイルから文字列を取得するには? s3fsとzgrepを介してインストールしようとしましたが、遅すぎました。使用する他の方法はありますか?
Amazonサービスを使用して迅速にzgrepできますか?
ベストアンサー1
私が見つけた最も速い方法は、まずローカルにコピーしてからローカルzgrepを実行することです。
aws s3 cp s3://bucket/containing/the/logs . --recursive
これにより、cp
すべてのログが現在のディレクトリ(.
)にコピーされ()、すべてのサブフォルダ(--recursive
)が含まれます。
その後、ローカルエントリは次のようになりますzgrep
。
zgrep "search words" *.gz
あるいは、サブディレクトリを再帰的に検索することもできます。
find -name \*.gz -print0 | xargs -0 zgrep "STRING"
(からインポートunix.stackexchange.com.)