Java文字列からHTMLを削除する良い方法はありますか?次のような単純な正規表現
replaceAll("\\<.*?>", "")
は機能しますが、 などの一部のものは&
正しく変換されず、2 つの山括弧の間の HTML 以外の部分は削除されます (つまり、.*?
正規表現内の は消えます)。
Java文字列からHTMLを削除する良い方法はありますか?次のような単純な正規表現
replaceAll("\\<.*?>", "")
は機能しますが、 などの一部のものは&
正しく変換されず、2 つの山括弧の間の HTML 以外の部分は削除されます (つまり、.*?
正規表現内の は消えます)。