Python での Unicode (UTF-8) ファイルの読み取りと書き込み質問する

Question

.encodeとをいじるのではなく.decode、ファイルを開くときにエンコーディングを指定します。ioモジュールPython 2.6 で追加されたは、io.openファイルのを指定できる関数を提供しますencoding。

ファイルが UTF-8 でエンコードされていると仮定すると、次を使用できます。

>>> import io
>>> f = io.open("test", mode="r", encoding="utf-8")

次に、f.readデコードされた Unicode オブジェクトを返します。

>>> f.read()
u'Capit\xe1l\n\n'

3.x では、io.open関数は組み込みopen関数のエイリアスであり、encoding引数をサポートします (2.x ではサポートされません)。

>>> import codecs
>>> f = codecs.open("test", "r", "utf-8")
>>> f.read()
u'Capit\xe1l\n\n'

Answer 1

.encodeとをいじるのではなく.decode、ファイルを開くときにエンコーディングを指定します。ioモジュールPython 2.6 で追加されたは、io.openファイルのを指定できる関数を提供しますencoding。

ファイルが UTF-8 でエンコードされていると仮定すると、次を使用できます。

>>> import io
>>> f = io.open("test", mode="r", encoding="utf-8")

次に、f.readデコードされた Unicode オブジェクトを返します。

>>> f.read()
u'Capit\xe1l\n\n'

3.x では、io.open関数は組み込みopen関数のエイリアスであり、encoding引数をサポートします (2.x ではサポートされません)。

>>> import codecs
>>> f = codecs.open("test", "r", "utf-8")
>>> f.read()
u'Capit\xe1l\n\n'

おすすめ記事