スタンフォードNLPのデモここ次のような出力が得られます。
Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.
品詞タグはどういう意味ですか? 公式リストを見つけることができません。これはスタンフォード独自のシステムですか、それともユニバーサルタグを使用していますか? (JJ
たとえば、 とは何ですか?)
また、たとえば名詞を探すために文章を反復処理しているとき、タグ かどうかを確認するような操作を行うことになります.contains('N')
。これはかなり弱い気がします。特定の品詞をプログラムで検索するより良い方法はありますか?
ベストアンサー1
ペン・ツリーバンク・プロジェクト見てください品詞タグ付け追伸
JJ は形容詞です。NNS は名詞の複数形です。VBP は動詞の現在形です。RB は副詞です。
これは英語用です。中国語用は Penn Chinese Treebank です。ドイツ語用は NEGRA corpus です。
- CC 接続詞
- CD基数
- DT 決定子
- EX そこに存在する
- FW 外国語
- IN 前置詞または従属接続詞
- JJ形容詞
- JJR 形容詞、比較級
- JJS 形容詞、最上級
- LS リスト項目マーカー
- MDモーダル
- NN 名詞、単数または集合
- NNS 名詞、複数形
- NNP 固有名詞、単数
- NNPS 固有名詞、複数
- PDT 事前決定子
- POS 所有格語尾
- PRP 人称代名詞
- PRP$ 所有代名詞
- RB 副詞
- RBR 副詞、比較級
- RBS 副詞、最上級
- RP パーティクル
- SYM シンボル
- に に
- UH 感嘆詞
- VB 動詞、基本形
- VBD 動詞、過去形
- VBG 動詞、動名詞または現在分詞
- VBN 動詞、過去分詞
- VBP 動詞、非三人称単数現在形
- VBZ 動詞、三人称単数現在形
- WDT ワット判定器
- WP 代名詞
- WP$ 所有格代名詞
- WRB 動詞