エラー UnicodeDecodeError: 'utf-8' コーデックは位置 0 のバイト 0xff をデコードできません: 開始バイトが無効です質問する

Question

Python はバイト配列 ( bytesUTF-8 でエンコードされた文字列であると想定される) を Unicode 文字列 ( str) に変換しようとします。このプロセスは、もちろん UTF-8 ルールに従ったデコードです。これを試みると、UTF-8 でエンコードされた文字列では許可されていないバイトシーケンス (つまり、位置 0 の 0xff) に遭遇します。

確認できるコードが提供されなかったため、残りについては推測することしかできませんでした。

スタックトレースから、トリガーとなるアクションはファイル ( contents = open(path).read()) からの読み取りであると推測できます。これを次のように再コーディングすることを提案します。

with open(path, 'rb') as f:
  contents = f.read()

bのモード指定子では、ファイルopen()はバイナリとして扱われる必要があると指定されているため、contentsのままになりますbytes。この方法ではデコードの試行は行われません。

Answer 1

Python はバイト配列 ( bytesUTF-8 でエンコードされた文字列であると想定される) を Unicode 文字列 ( str) に変換しようとします。このプロセスは、もちろん UTF-8 ルールに従ったデコードです。これを試みると、UTF-8 でエンコードされた文字列では許可されていないバイトシーケンス (つまり、位置 0 の 0xff) に遭遇します。

確認できるコードが提供されなかったため、残りについては推測することしかできませんでした。

スタックトレースから、トリガーとなるアクションはファイル ( contents = open(path).read()) からの読み取りであると推測できます。これを次のように再コーディングすることを提案します。

with open(path, 'rb') as f:
  contents = f.read()

bのモード指定子では、ファイルopen()はバイナリとして扱われる必要があると指定されているため、contentsのままになりますbytes。この方法ではデコードの試行は行われません。

エラー UnicodeDecodeError: 'utf-8' コーデックは位置 0 のバイト 0xff をデコードできません: 開始バイトが無効です質問する

ベストアンサー1

おすすめ記事