予測確率を自分で生成できるように、ロジスティック回帰係数を返す方法を知る必要があります。
私のコードは次のようになります:
lr = LogisticRegression()
lr.fit(training_data, binary_labels)
# Generate probabities automatically
predicted_probs = lr.predict_proba(binary_labels)
lr.coeff_ の値は典型的なロジスティック回帰に従うと想定していたため、次のように予測確率を返すことができました。
sigmoid( dot([val1, val2, offset], lr.coef_.T) )
しかし、これは適切な定式化ではありません。Scikit Learn LogisticRegression から予測確率を生成するための適切な形式を持っている人はいますか? よろしくお願いします!
ベストアンサー1
ドキュメントをご覧ください(http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html)、オフセット係数はlr.coef_によって保存されません。
coef_ 配列、形状 = [n_classes-1、n_features] 決定関数の特徴の係数。coef_ は、liblinear の内部メモリ レイアウトに従う raw_coef_ から派生した読み取り専用プロパティです。intercept_ 配列、形状 = [n_classes-1] 決定関数に追加された切片 (別名バイアス)。パラメーター intercept が True に設定されている場合にのみ使用できます。
試す:
sigmoid( dot([val1, val2], lr.coef_) + lr.intercept_ )