Textblob を使用してテキスト分類を実行しようとしています。まずモデルをトレーニングし、以下に示すように pickle を使用してシリアル化します。
import pickle
from textblob.classifiers import NaiveBayesClassifier
with open('sample.csv', 'r') as fp:
cl = NaiveBayesClassifier(fp, format="csv")
f = open('sample_classifier.pickle', 'wb')
pickle.dump(cl, f)
f.close()
このファイルを実行しようとすると、次のようになります。
import pickle
f = open('sample_classifier.pickle', encoding="utf8")
cl = pickle.load(f)
f.close()
次のエラーが発生します:
UnicodeDecodeError: 'utf-8' コーデックは位置 0 のバイト 0x80 をデコードできません: 開始バイトが無効です
以下は私の sample.csv の内容です。
私のSQLはまったく正しく動作しません。これは間違った選択でした。SQL
問題があります。すぐに対応してください。サポート
どこが間違っているのでしょうか? 助けてください。
ベストアンサー1
open
モードでファイルを選択するとwb
、生のバイナリで書き込むことを選択することになります。文字エンコードは適用されません。
したがって、このファイルを読み取るには、単にopen
モードにする必要がありますrb
。