UnicodeDecodeError、無効な継続バイト質問する

2024-07-07 • tag-icon

以下の項目が失敗するのはなぜですか? 「latin-1」コーデックではなぜ成功するのですか?

o = "a test of \xe9 char" #I want this to remain a string as this is what I am receiving
v = o.decode("utf-8")

その結果は次のようになります:

 Traceback (most recent call last):  
 File "<stdin>", line 1, in <module>  
 File "C:\Python27\lib\encodings\utf_8.py",
 line 16, in decode
     return codecs.utf_8_decode(input, errors, True) UnicodeDecodeError:
 'utf8' codec can't decode byte 0xe9 in position 10: invalid continuation byte

ベストアンサー1

pandas.read_csvメソッドで CSV ファイルを開こうとしたときに、同じエラーが発生しました。

解決策は、エンコーディングを次のように変更することですlatin-1。

pd.read_csv('ml-100k/u.item', sep='|', names=m_cols , encoding='latin-1')

ベストアンサー1

おすすめ記事