/usr/share/dict/wordsの単語はどこから来たのですか?

/usr/share/dict/wordsの単語はどこから来たのですか?

/usr/share/dict/words多くの単語が含まれています。このリストはどのように生成されますか?他のUnicesでも内容は同じですか?どのような内容を含めるべきかを規定する標準はありますか?

これまで私が見つけることができるのはUbuntu / Debianだけです。このリストは以下から得られた。単語リストパッケージの説明は、リストが実際にどのように生成されるかについての手がかりを提供しません。

ベストアンサー1

いろいろな質問をしましたが、私が考える主な質問は次のとおりです。

どのような内容を含めるべきかを規定する標準はありますか?

私が知る限り、いいえ。

これに照らして、関連する質問は次のとおりです。

このリストはどのように生成されますか?他のUnicesでも内容は同じですか?

「それぞれのUnixによって異なります」と答えてください。

オペレーティングシステムの一部として単語リストを持つ規則は次のとおりです。spell(1)ユーティリティ、元のスペルチェックプロセスに使用されます。

スペルチェッカーは学術論文で説明されています。「スペルリストの開発」 McIlroy, MD, Bell Laboratories, 1982

スペルリストがどこから来たのか、どのように生成されるのか、どのような選択肢があるのか​​を確認するには、オペレーティングシステムのパッケージマネージャを確認する必要があります。

Debian GNU+Linux を例に挙げます:

  • この/usr/share/dict/wordsファイルは、Debianの「代替」システムを使用して管理されるシンボリックリンクです。
  • このリンクを提供するユニバーサルワードリストパッケージはwamericanパッケージです。
  • パッケージ文書には、wamericanその単語のリストが以下に由来することが示されています。SCOWL(スペルチェッカー用の単語リスト)プロジェクト。

インストールできる他の単語リストパッケージがたくさんあります。各パッケージには「提供:単語リスト」フィールドがあります。

$ aptitude search '?provides(wordlist)' | wc -l
34

他のUnicesでは、単語リストのソースと置換を理解するために、パッケージシステムと文書を確認する必要があります。

おすすめ記事