私は機械学習モデルを構築しようとしています。
トレーニングデータと検証データが必要です
たとえば、N 個の例がある場合、データ フレームからランダムに x 個の例を選択します。
たとえば、100 個の例があり、10 個の乱数が必要だとします。サンプル データからトレーニング データを抽出するために、10 個のランダムな INTEGER 数を (効率的に) 生成する方法はありますか?
while ループを使用して、繰り返しの数字をゆっくり変更してみましたが、実行時間はあまり理想的ではないため、より効率的な方法を探しています。
誰か助けてくれませんか?
ベストアンサー1
sample
(またはsample.int
)はこれを行います:
sample.int(100, 10)
# [1] 58 83 54 68 53 4 71 11 75 90
は、1~100の範囲から10個の乱数を生成します。おそらくreplace = TRUE
、 を置き換えてサンプリングする が必要でしょう。
sample.int(20, 10, replace = TRUE)
# [1] 10 2 11 13 9 9 3 13 3 17
より一般的には、任意の値のベクトルから観測値sample
をサンプリングします。n