ニューラルネットワークでk分割交差検証を使用する方法質問する

Question

少し混乱しているようですね (私もそうだったのを覚えています) ので、簡単に説明したいと思います。 ;)

ニューラルネットワークのシナリオ例

ニューラルネットワークを考案するなどのタスクを与えられるときはいつでも、トレーニング目的で使用するサンプルデータセットも与えられることがよくあります。ここでは、重みベクトルと指定されたサンプルベクトルのスカラー積 (·) を計算して出力が算出される単純なニューラルネットワークシステムをトレーニングしていると仮定しますY = W · X。YここWでX、これを行う単純な方法は、たとえば 1000 サンプルのデータセット全体を使用してニューラルネットワークをトレーニングすることです。トレーニングが収束し、重みが安定すると仮定すると、ネットワークがトレーニングデータを正しく分類すると安全に言えます。しかし、これまでに見たことのないデータが提示された場合、ネットワークに何が起こるでしょうか?明らかに、このようなシステムの目的は、トレーニングに使用されたデータ以外のデータを一般化し、正しく分類できるようにすることです。

過剰適合の説明

しかし、現実世界の状況では、これまで見たことのない/新しいデータは、ニューラルネットワークが、いわゆる本番環境に導入されたときにのみ利用できます。しかし、十分にテストしていないので、おそらく苦労するでしょう。:) 学習システムがトレーニングセットにほぼ完璧に一致するのに、見たことのないデータでは常に失敗する現象は、過剰適合。

3つのセット

ここでアルゴリズムの検証とテストの部分が出てきます。元の1000サンプルのデータセットに戻りましょう。これを3つのセットに分割します。トレーニング、検証そしてテスト( Tr、VaおよびTe) -- 慎重に選択された比率を使用します。(80-10-10)% は通常適切な比率です。

Tr = 80%
Va = 10%
Te = 10%

トレーニングと検証

ここで何が起こるかというと、ニューラルネットワークはTrセットでトレーニングされ、その重みが正しく更新されます。次に、検証セットを使用して、トレーニングから得られた重みを使用してVa分類エラーを計算します。ここで、は検証セットから取得された期待出力ベクトルであり、は分類から得られた計算された出力です（）。エラーがユーザー定義のしきい値よりも高い場合、E = M - YMYY = W * Xトレーニング検証エポック繰り返します。検証セットを使用して計算されたエラーが十分に低いと判断された時点で、このトレーニングフェーズは終了します。

スマートトレーニング

ここでの賢い策略はトレーニングと検証に使用するサンプルをランダムに選択する各エポック反復で合計セットから抽出しますTr + Va。これにより、ネットワークがトレーニングセットに過剰適合することがなくなります。

テスト

次に、テストセットをTe使用してネットワークのパフォーマンスを測定します。このデータは、トレーニングおよび検証フェーズで使用されたことがないため、この目的に最適です。これは、実質的には、ネットワークが実稼働環境に展開されたときに何が起こるかを模倣する、これまで見たことのない小さなデータセットです。

パフォーマンスは、上で説明したように分類エラーの観点から測定されます。パフォーマンスは、次の観点からも測定できます（または測定すべきかもしれません）。精度と再現性エラーがどこでどのように発生したかを知るためですが、それは別の Q&A のトピックです。

クロス検証

このトレーニング・検証・テストのメカニズムを理解したら、ネットワークをさらに強化して過剰適合を防ぐことができます。K分割交差検証これは、上で説明した巧妙な策略の進化版です。このテクニックには、異なる、重複しない、均等に配分されたTr、VaおよびTeセットに対して、K ラウンドのトレーニング、検証、テストを実行する。

が与えられた場合k = 10、K の各値に対してデータセットをとに分割しTr+Va = 90%、Te = 10%アルゴリズムを実行してテストのパフォーマンスを記録します。

k = 10
for i in 1:k
     # Select unique training and testing datasets
     KFoldTraining <-- subset(Data)
     KFoldTesting <-- subset(Data)

     # Train and record performance
     KFoldPerformance[i] <-- SmartTrain(KFoldTraining, KFoldTesting)

# Compute overall performance
TotalPerformance <-- ComputePerformance(KFoldPerformance)

過剰適合が見られる

私は以下の世界的に有名なプロットをウィキペディア検証セットがオーバーフィッティングの防止にどのように役立つかを示します。青で示されるトレーニングエラーは、エポック数が増えるにつれて減少する傾向があります。つまり、ネットワークはトレーニングセットに正確に一致させようとしています。一方、赤で示される検証エラーは、異なる U 字型のプロファイルに従います。曲線の最小値は、トレーニングと検証エラーが最小になるポイントであるため、理想的にはトレーニングを停止する必要があります。

ニューラルネットワークの検証により過剰適合が減少

参考文献

詳しい参考資料この素晴らしい本機械学習に関する確かな知識といくつかの頭痛の両方が得られます。価値があるかどうかはあなた次第です。:)

Answer 1

少し混乱しているようですね (私もそうだったのを覚えています) ので、簡単に説明したいと思います。 ;)

ニューラルネットワークのシナリオ例

ニューラルネットワークを考案するなどのタスクを与えられるときはいつでも、トレーニング目的で使用するサンプルデータセットも与えられることがよくあります。ここでは、重みベクトルと指定されたサンプルベクトルのスカラー積 (·) を計算して出力が算出される単純なニューラルネットワークシステムをトレーニングしていると仮定しますY = W · X。YここWでX、これを行う単純な方法は、たとえば 1000 サンプルのデータセット全体を使用してニューラルネットワークをトレーニングすることです。トレーニングが収束し、重みが安定すると仮定すると、ネットワークがトレーニングデータを正しく分類すると安全に言えます。しかし、これまでに見たことのないデータが提示された場合、ネットワークに何が起こるでしょうか?明らかに、このようなシステムの目的は、トレーニングに使用されたデータ以外のデータを一般化し、正しく分類できるようにすることです。

過剰適合の説明

しかし、現実世界の状況では、これまで見たことのない/新しいデータは、ニューラルネットワークが、いわゆる本番環境に導入されたときにのみ利用できます。しかし、十分にテストしていないので、おそらく苦労するでしょう。:) 学習システムがトレーニングセットにほぼ完璧に一致するのに、見たことのないデータでは常に失敗する現象は、過剰適合。

3つのセット

ここでアルゴリズムの検証とテストの部分が出てきます。元の1000サンプルのデータセットに戻りましょう。これを3つのセットに分割します。トレーニング、検証そしてテスト( Tr、VaおよびTe) -- 慎重に選択された比率を使用します。(80-10-10)% は通常適切な比率です。

Tr = 80%
Va = 10%
Te = 10%

トレーニングと検証

ここで何が起こるかというと、ニューラルネットワークはTrセットでトレーニングされ、その重みが正しく更新されます。次に、検証セットを使用して、トレーニングから得られた重みを使用してVa分類エラーを計算します。ここで、は検証セットから取得された期待出力ベクトルであり、は分類から得られた計算された出力です（）。エラーがユーザー定義のしきい値よりも高い場合、E = M - YMYY = W * Xトレーニング検証エポック繰り返します。検証セットを使用して計算されたエラーが十分に低いと判断された時点で、このトレーニングフェーズは終了します。

スマートトレーニング

ここでの賢い策略はトレーニングと検証に使用するサンプルをランダムに選択する各エポック反復で合計セットから抽出しますTr + Va。これにより、ネットワークがトレーニングセットに過剰適合することがなくなります。

テスト

次に、テストセットをTe使用してネットワークのパフォーマンスを測定します。このデータは、トレーニングおよび検証フェーズで使用されたことがないため、この目的に最適です。これは、実質的には、ネットワークが実稼働環境に展開されたときに何が起こるかを模倣する、これまで見たことのない小さなデータセットです。

パフォーマンスは、上で説明したように分類エラーの観点から測定されます。パフォーマンスは、次の観点からも測定できます（または測定すべきかもしれません）。精度と再現性エラーがどこでどのように発生したかを知るためですが、それは別の Q&A のトピックです。

クロス検証

このトレーニング・検証・テストのメカニズムを理解したら、ネットワークをさらに強化して過剰適合を防ぐことができます。K分割交差検証これは、上で説明した巧妙な策略の進化版です。このテクニックには、異なる、重複しない、均等に配分されたTr、VaおよびTeセットに対して、K ラウンドのトレーニング、検証、テストを実行する。

が与えられた場合k = 10、K の各値に対してデータセットをとに分割しTr+Va = 90%、Te = 10%アルゴリズムを実行してテストのパフォーマンスを記録します。

k = 10
for i in 1:k
     # Select unique training and testing datasets
     KFoldTraining <-- subset(Data)
     KFoldTesting <-- subset(Data)

     # Train and record performance
     KFoldPerformance[i] <-- SmartTrain(KFoldTraining, KFoldTesting)

# Compute overall performance
TotalPerformance <-- ComputePerformance(KFoldPerformance)

過剰適合が見られる

私は以下の世界的に有名なプロットをウィキペディア検証セットがオーバーフィッティングの防止にどのように役立つかを示します。青で示されるトレーニングエラーは、エポック数が増えるにつれて減少する傾向があります。つまり、ネットワークはトレーニングセットに正確に一致させようとしています。一方、赤で示される検証エラーは、異なる U 字型のプロファイルに従います。曲線の最小値は、トレーニングと検証エラーが最小になるポイントであるため、理想的にはトレーニングを停止する必要があります。

ニューラルネットワークの検証により過剰適合が減少

参考文献

詳しい参考資料この素晴らしい本機械学習に関する確かな知識といくつかの頭痛の両方が得られます。価値があるかどうかはあなた次第です。:)

ニューラルネットワークでk分割交差検証を使用する方法質問する

ベストアンサー1

ニューラルネットワークのシナリオ例

過剰適合の説明

3つのセット

トレーニングと検証

スマートトレーニング

テスト

クロス検証

過剰適合が見られる

参考文献

おすすめ記事