データフレームの形式でかなり大きなデータセットがあり、トレーニングとテストのためにデータフレームを 2 つのランダム サンプル (80% と 20%) に分割する方法を知りたいです。
ありがとう!
ベストアンサー1
Scikit Learnのtrain_test_split
良いものです。NumPy 配列とデータフレームの両方を分割します。
from sklearn.model_selection import train_test_split
train, test = train_test_split(df, test_size=0.2)