コマンドラインに優しいフルテキストインデックス付け?

コマンドラインに優しいフルテキストインデックス付け?

コマンドラインからクエリでき、理想的にはGUIをまったく使用する必要がないフルテキストインデックスエンジンのようなものはありますか?

私は特に電子ブックや論文のインデックスを作成することに興味があるので、ここにはpdf、epub、いくつかのdjvuが混在しています。 (公開)Office文書があればいいのですが、私のリストでははるかに低いです。

ベストアンサー1

LuceneやSphinxを見ましたか?まず、索引付けしたい文書を解析する必要がありますが、完了したら、cliでそのうちの1つを検索できます。

Luceneの場合、このタスクに関するいくつかの情報があります。書くことができる

Sphinx、少しあいまいですが、いくつかの文書もあります書くことができる。 xmlpipe2データソースを使用すると、必要な構造化XMLデータをスフィンクスに渡すことができます。

LuceneはJavaを使用しますが、SphinxはC ++で構築されており、外部依存関係は必要ありません。

どちらにしても欲しいものを達成するには少し作業が必要ですが、完全に実行可能な解決策のようです。

おすすめ記事