HTML の特殊文字を削除するにはどうすればいいですか? [重複] 質問する

HTML の特殊文字を削除するにはどうすればいいですか? [重複] 質問する

私は自分のアプリケーション用の RSS フィード ファイルを作成していますが、その中で HTML タグを削除したいのですが、これは によって実行されますstrip_tags。しかし、strip_tagsHTML 特殊コード文字は削除されません。

  & © 

文字列からこれらの特殊コード文字を削除するために使用できる関数を教えてください。

ベストアンサー1

を使用してデコードするかhtml_entity_decode、またはを使用して削除しますpreg_replace

$Content = preg_replace("/&#?[a-z0-9]+;/i","",$Content); 

(からここ

編集: Jacco のコメントによる代替案

'+' を {2,8} などに置き換えるとよいかもしれません。これにより、エンコードされていない '&' が存在する場合に文全体が置き換えられる可能性が制限されます。

$Content = preg_replace("/&#?[a-z0-9]{2,8};/i","",$Content); 

おすすめ記事