私は最近、GNU再エンコードを使用してHTMLエンティティをデコードできることを発見しました。しかし、マルウェアを見てみると、これは混在したHTML文字/エンティティエンコーディングのようです。悪意のあるドメインのURLをexample.comに変更しました。
https://example.com/
パイプすると、recode html..ascii
次の結果が得られ、数値エンティティはデコードされますが、文字エンティティはデコードされません。
https://example.com/
処理される形式の良い文書が見つかりませんでしたrecode
。文字エンティティをデコードするための2番目のステップを実行する方法はありますか?それとも、デコードに使用できるより良いcliツールはありますか?