Python で文字列から \xa0 を削除するにはどうすればいいですか? 質問する

Question

\xa0 は実際には Latin1 (ISO 8859-1) の非改行スペースであり、chr(160) でもあります。これをスペースに置き換える必要があります。

string = string.replace(u'\xa0', u' ')

.encode('utf-8') の場合、Unicode は UTF-8 にエンコードされます。つまり、すべての Unicode は 1 ～ 4 バイトで表すことができます。この場合、\xa0 は 2 バイトの \xc2\xa0 で表されます。

よく読んでユニコード。

unicodedata.normalize注意：この回答は2012年のものですが、Pythonは進化しており、現在でも使用できるはずです。

Answer 1

\xa0 は実際には Latin1 (ISO 8859-1) の非改行スペースであり、chr(160) でもあります。これをスペースに置き換える必要があります。

string = string.replace(u'\xa0', u' ')

.encode('utf-8') の場合、Unicode は UTF-8 にエンコードされます。つまり、すべての Unicode は 1 ～ 4 バイトで表すことができます。この場合、\xa0 は 2 バイトの \xc2\xa0 で表されます。

よく読んでユニコード。

unicodedata.normalize注意：この回答は2012年のものですが、Pythonは進化しており、現在でも使用できるはずです。

おすすめ記事