ロジットとは何ですか? softmax と softmax_cross_entropy_with_logits の違いは何ですか? 質問する

Question

softmax+logits は、関数が以前のレイヤーのスケールされていない出力に対して動作し、単位を理解するための相対スケールが線形であることを意味します。特に、入力の合計が 1 にならない場合があり、値が確率ではないことを意味します(入力が 5 になる場合があります)。内部的には、最初にスケールされていない出力に softmax を適用し、次にそれらの値のクロスエントロピーと、ラベルによって定義された「あるべき」値を計算し、次にそれらの値をクロスエントロピーとして計算します。

tf.nn.softmaxを適用した結果を生成しますソフトマックス関数を入力テンソルに渡します。ソフトマックスは入力をとなるように「圧縮」しsum(input) = 1、入力を対数確率 (ロジット) として解釈してマッピングを行い、その後 0 から 1 の間の生の確率に戻します。ソフトマックスの出力の形状は入力と同じです。

a = tf.constant(np.array([[.1, .3, .5, .9]]))
print s.run(tf.nn.softmax(a))
[[ 0.16838508  0.205666    0.25120102  0.37474789]]

見るこの答えDNN でソフトマックスが広く使用されている理由について詳しくは、こちらをご覧ください。

tf.nn.softmax_cross_entropy_with_logitsソフトマックス関数を適用した後のクロスエントロピー損失の計算とソフトマックスステップを組み合わせますが、より数学的に慎重な方法ですべてを実行します。次の結果に似ています。

sm = tf.nn.softmax(x)
ce = cross_entropy(sm)

クロスエントロピーは要約メトリックです。要素全体を合計します。tf.nn.softmax_cross_entropy_with_logitsシェイプ[2,5]テンソルの出力はシェイプです[2,1](最初の次元はバッチとして扱われます)。

クロスエントロピーを最小化するために最適化を行い、かつ最後のレイヤーの後でソフトマックスを行う場合は、tf.nn.softmax_cross_entropy_with_logits自分で行うのではなくを使用する必要があります。これは、数値的に不安定なコーナーケースを数学的に正しい方法でカバーするためです。そうしないと、あちこちに小さなイプシロンを追加してハッキングすることになります。

2016-02-07 編集:オブジェクトが 1 つのクラスにしか属せない単一クラスのラベルがある場合は、tf.nn.sparse_softmax_cross_entropy_with_logitsラベルを密な one-hot 配列に変換する必要がないように、の使用を検討してください。この関数は、リリース 0.6.0 以降に追加されました。

Answer 1