「for line in...」の結果は UnicodeDecodeError: 'utf-8' コーデックはバイトをデコードできません 質問する

「for line in...」の結果は UnicodeDecodeError: 'utf-8' コーデックはバイトをデコードできません 質問する

これが私のコードです。

for line in open('u.item'):
# Read each line

このコードを実行すると、常に次のエラーが発生します。

UnicodeDecodeError: 'utf-8' コーデックは位置 2892 のバイト 0xe9 をデコードできません: 継続バイトが無効です

これを解決するために、open() に追加のパラメータを追加してみました。コードは次のようになります。

for line in open('u.item', encoding='utf-8'):
# Read each line

しかし、また同じエラーが発生します。どうすればいいでしょうか?

ベストアンサー1

としてマーク・ランサムの提案、私はその問題に対する正しいエンコードを見つけました。エンコードは"ISO-8859-1"open("u.item", encoding="utf-8")を に置き換えるとopen('u.item', encoding = "ISO-8859-1")問題は解決します。

おすすめ記事