ソートされたテキストファイル内で最高のコマンドライン検索

2024-06-26 • tag-icon

command-line optimization

アルファベット順に並べられた数十億行のテキストを含むテキストファイルがあるとします。

Bar=10
Foo=6
Naz=42

行がアルファベット順に並んでいて、探している行が次から始める必要があることを知っています（ファイルにはこのような数十億の変数が含まれています）、最適化された方法で始まる行を検索するのに最適な方法は何ですか？Foo？検索が簡単です）特定のテキストを探していますか？

編集する：

この質問は重複した質問と見なすことができます。https://askubuntu.com/q/423886/10473 答えは、look そのような研究を実行するのに十分な速さを使用することです。

これがあなたが話しているボリュームにどのように拡張されるかはわかりませんが、次のようなファイルで動作するようです。

Foo=123
Foobar=646
Foobar=85489
Noo=8654
Noobar=8262

awk -F= '{if ($1 > "Foobar") { exit } ; if ($1 == "Foobar") { print $0 } }' sorted.txt

これは単なる概念証明である。一致させたい用語が渡されるように調整するのは簡単な問題です。

おすすめ記事