辞書に近づく

辞書に近づく

250,000個の辞書項目が複数のファイルに分かれているとしましょう。各ファイルは用語を含む行で始まります。合わせて2GBです。簡単かつ迅速に単語を見つけるために情報を整理するための最良の方法は何ですか?サブディレクトリabcなどを作成する必要がありますか?複数のファイルをより大きなファイルにマージする必要がありますか?

ベストアンサー1

あなたは何をしたいのか、データが何であるかについてあまり話していませんが、私の考えは次のとおりです。すべての単語が一意であると仮定します。ディスクスペースの効率的な使用について懸念するとは言わなかった。

Ext4ファイルシステム。各単語を大きなディレクトリの別々のファイルに保存します。ファイルシステムが自動的にファイルを検索できるようにします。これは非常に簡単で(必要なファイルを名前で開くだけです)、ファイルシステムはファイルを見つける効率的な方法を提供します。

ファイルシステムに十分な空きノードがあることを確認する必要があります(ファイルごとに1つずつ)。したがって、250,000個の空きinodeが必要ですdu -i

lsファイルを列挙する必要があるタスクやその他のタスク(ファイルブラウザでファイルを開く)を実行すると、パフォーマンスが向上します。

おすすめ記事