ニューラルネットワークが収束しないときに試すべきこと質問する

Question

ReLU活性化を使用している場合は、「死にゆくReLU」問題です。簡単に言うと、特定の条件下では、ReLU アクティベーションを持つニューロンはどれも (バイアス) 調整の対象となり、二度とアクティベートされなくなる可能性があります。これは、その記事で詳しく説明されている「Leaky ReLU」アクティベーションで修正できます。

たとえば、ReLU 出力を持つ単純な MLP (3 層) ネットワークを作成しましたが、失敗しました。絶対に失敗するはずのないデータを提供しましたが、それでも失敗しました。学習率を大幅に下げると、失敗が遅くなりました。常に各クラスを同じ確率で予測することに収束しました。これは、標準の ReLU ではなく Leaky ReLU を使用することですべて修正されました。

Answer 1

ReLU活性化を使用している場合は、「死にゆくReLU」問題です。簡単に言うと、特定の条件下では、ReLU アクティベーションを持つニューロンはどれも (バイアス) 調整の対象となり、二度とアクティベートされなくなる可能性があります。これは、その記事で詳しく説明されている「Leaky ReLU」アクティベーションで修正できます。

たとえば、ReLU 出力を持つ単純な MLP (3 層) ネットワークを作成しましたが、失敗しました。絶対に失敗するはずのないデータを提供しましたが、それでも失敗しました。学習率を大幅に下げると、失敗が遅くなりました。常に各クラスを同じ確率で予測することに収束しました。これは、標準の ReLU ではなく Leaky ReLU を使用することですべて修正されました。

ニューラルネットワークが収束しないときに試すべきこと質問する

ベストアンサー1

おすすめ記事