ユースケース:1週間にわたって数GBのログファイルがあり、たとえばgrep
知識に基づいて推測してファイルの途中で検索を開始すると、処理時間が半分以上短縮されるとします。関連データをスキップせずにファイルセクションの残りの部分全体を処理する必要はありません。可能ですか?
ベストアンサー1
データが時系列でソートされているとします。
- 最後を見て、次のようにしてファイルサイズを確認してください
ftell()
。 - 結果を2で割ります。
fseek()
場所を見つけるために使用されます。- 一度呼び出して、次の行の先頭を見つけます
getline()
。 strptime()
現在の日付を知るために使用されます。- バイナリ検索を実行し、目的の行が見つかるまで手順4と5を繰り返します。