コマンドラインからRSSフィードを解析しようとしています。これまでのところ、コードは機能しましたが、フィードに著作権記号が含まれていますが、それを削除しようとしました(latin1でエンコードされています)。 Maybeを使用して著作権記号(\xA9
)を削除するにはsed
?
ベストアンサー1
これが唯一の問題であれば、@Kevinのコメントに同意します。フィード全体がUTF-8でない場合は、tr -cd SET
SETに含まれていないすべての文字を削除するか、iconv -f (encoding) -t utf-8
フィードのエンコーディングを知っている場合を検討してください。