著作権記号の削除

著作権記号の削除

コマンドラインからRSSフィードを解析しようとしています。これまでのところ、コードは機能しましたが、フィードに著作権記号が含まれていますが、それを削除しようとしました(latin1でエンコードされています)。 Maybeを使用して著作権記号(\xA9)を削除するにはsed

ベストアンサー1

これが唯一の問題であれば、@Kevinのコメントに同意します。フィード全体がUTF-8でない場合は、tr -cd SETSETに含まれていないすべての文字を削除するか、iconv -f (encoding) -t utf-8フィードのエンコーディングを知っている場合を検討してください。

おすすめ記事