私は自分のアプリケーション用の RSS フィード ファイルを作成していますが、その中で HTML タグを削除したいのですが、これは によって実行されますstrip_tags
。しかし、strip_tags
HTML 特殊コード文字は削除されません。
& ©
等
文字列からこれらの特殊コード文字を削除するために使用できる関数を教えてください。
ベストアンサー1
を使用してデコードするかhtml_entity_decode
、またはを使用して削除しますpreg_replace
。
$Content = preg_replace("/&#?[a-z0-9]+;/i","",$Content);
(からここ)
編集: Jacco のコメントによる代替案
'+' を {2,8} などに置き換えるとよいかもしれません。これにより、エンコードされていない '&' が存在する場合に文全体が置き換えられる可能性が制限されます。
$Content = preg_replace("/&#?[a-z0-9]{2,8};/i","",$Content);