pandas を使用して 1 つのデータフレームからテスト サンプルとトレーニング サンプルを作成するにはどうすればよいですか? 質問する

pandas を使用して 1 つのデータフレームからテスト サンプルとトレーニング サンプルを作成するにはどうすればよいですか? 質問する

データフレームの形式でかなり大きなデータセットがあり、トレーニングとテストのためにデータフレームを 2 つのランダム サンプル (80% と 20%) に分割する方法を知りたいです。

ありがとう!

ベストアンサー1

Scikit Learnのtrain_test_split良いものです。NumPy 配列とデータフレームの両方を分割します。

from sklearn.model_selection import train_test_split

train, test = train_test_split(df, test_size=0.2)

おすすめ記事