Python ピクルエラー: UnicodeDecodeError 質問する

Python ピクルエラー: UnicodeDecodeError 質問する

Textblob を使用してテキスト分類を実行しようとしています。まずモデルをトレーニングし、以下に示すように pickle を使用してシリアル化します。

import pickle
from textblob.classifiers import NaiveBayesClassifier

with open('sample.csv', 'r') as fp:
     cl = NaiveBayesClassifier(fp, format="csv")

f = open('sample_classifier.pickle', 'wb')
pickle.dump(cl, f)
f.close()

このファイルを実行しようとすると、次のようになります。

import pickle
f = open('sample_classifier.pickle', encoding="utf8")
cl = pickle.load(f)    
f.close()

次のエラーが発生します:

UnicodeDecodeError: 'utf-8' コーデックは位置 0 のバイト 0x80 をデコードできません: 開始バイトが無効です

以下は私の sample.csv の内容です。

私のSQLはまったく正しく動作しません。これは間違った選択でした。SQL

問題があります。すぐに対応してください。サポート

どこが間違っているのでしょうか? 助けてください。

ベストアンサー1

openモードでファイルを選択するとwb、生のバイナリで書き込むことを選択することになります。文字エンコードは適用されません。

したがって、このファイルを読み取るには、単にopenモードにする必要がありますrb

おすすめ記事