GNU Recode - 混合HTML文字/数値エンコードテキストを正しくデコードしますか?

GNU Recode - 混合HTML文字/数値エンコードテキストを正しくデコードしますか?

私は最近、GNU再エンコードを使用してHTMLエンティティをデコードできることを発見しました。しかし、マルウェアを見てみると、これは混在したHTML文字/エンティティエンコーディングのようです。悪意のあるドメインのURLをexample.comに変更しました。

https://example.com/

パイプすると、recode html..ascii次の結果が得られ、数値エンティティはデコードされますが、文字エンティティはデコードされません。

https://example.com/

処理される形式の良い文書が見つかりませんでしたrecode。文字エンティティをデコードするための2番目のステップを実行する方法はありますか?それとも、デコードに使用できるより良いcliツールはありますか?

ベストアンサー1

おすすめ記事