HTMLエンティティを読みやすいテキストに変換するには?

HTMLエンティティを読みやすいテキストに変換するには?

ęのようなHTML数値エンティティが欲しいので、それを実際の文字に変換したいと思います。私の電子メールは主に次のリンクドインから来ました。

chciałabym zapytać, czy rozważa Pan takze udział ワルシャワで現在進行中のプロジェクトは何ですか? Obecnie poszukujemy 仕様は javascript/architekta z bardzo dobrą znajomością Angular.js do プロジェクト, który dotyczy systemu, służącego do monitorowania および zarządzania flotą pojazdów です。 Zespół, do którego poszukujemy

私はClawsmailを使用していますが、htmlに切り替えてテキストに変換せずにコピーして使用してみました。

xclip -o -sel clip | html2text | less

ただし、エンティティを変換しません。コマンドラインツールを使用してテキストをインポートする方法はありますか?

私が考えることができる唯一の方法は、data:text/html,<PASTE THE EMAIL>ブラウザで使用して開くことですが、コマンドラインを好みます。

ベストアンサー1

recode無料(以前のGNU)を使用recode

recode html < file

エンティティがない場合、またはエンティティをデコードする必要があるrecode場合は、次のように手動で実行できます。HTML::Entities&#x<hex>;

perl -Mopen=locale -pe 's/&#x([\da-f]+);/chr hex $1/gie'

おすすめ記事