Webページで値のリストを作成するには?

Webページで値のリストを作成するには?

このページからMediaWiki特殊ページ(名前空間ページなど)のリストがあり、これらSpecial:すべての名前の簡単なテキストリストを自動的に作成したいと思います。

そのWebページに表示されるすべての名前と一致する一致パターンはSpecial:^[A-Z][a-z]*:

すべての名前を含む単純なテキストリストを作成するには?

ベストアンサー1

ウィキペディアの特別ページのウェブページを参照しているとします。https://en.wikipedia.org/wiki/Help:Special_page、これはあなたの質問で述べたものとまったく一致しません。

これは有効なXMLを生成するため、などのXMLツールで使用できますxmlstarlet。これにより、XPathパスを使用してページを識別し、次に始まるかどうかを確認してページを簡単に一覧表示できますSpecial:

curl https://en.wikipedia.org/wiki/Help:Special_page |
    xmlstarlet sel -t -v '//ul/li/a[starts-with(text(),"Special:")]' -n

出力例

Special:SpecialPages
Special:AllMessages (System messages)
Special:Statistics
Special:Version
Special:SiteMatrix (Wikimedia wikis)
Special:AllPages
Special:AllPages/T
...

パスを少し変更して、返されるページ名のセットを制限できます。最初は使っていましたが、/div[@id="mw-content-text"]/div/ul/li/a[starts-with(text(),"Special:")]簡単な要件に比べて複雑すぎるようです。」リストを書くみんなこれらの名前」。

おすすめ記事