if-elif-else条件に基づいて新しい列を作成する [重複] 質問する

Question

上記のアプローチのいくつかを形式化するには、次のようになります。

次のようにデータフレームの行を操作する関数を作成します。

def f(row):
    if row['A'] == row['B']:
        val = 0
    elif row['A'] > row['B']:
        val = 1
    else:
        val = -1
    return val

次に、オプションを渡してデータフレームに適用しますaxis=1。

In [1]: df['C'] = df.apply(f, axis=1)

In [2]: df
Out[2]:
   A  B  C
a  2  2  0
b  3  1  1
c  1  3 -1

もちろん、これはベクトル化されていないので、多数のレコードにスケーリングするとパフォーマンスはそれほど良くない可能性があります。それでも、はるかに読みやすくなっていると思います。特に SAS のバックグラウンドを持つ人にとってはそうです。

編集

こちらはベクトル化されたバージョンです

df['C'] = np.where(
    df['A'] == df['B'], 0, np.where(
    df['A'] >  df['B'], 1, -1))

Answer 1

上記のアプローチのいくつかを形式化するには、次のようになります。

次のようにデータフレームの行を操作する関数を作成します。

def f(row):
    if row['A'] == row['B']:
        val = 0
    elif row['A'] > row['B']:
        val = 1
    else:
        val = -1
    return val

次に、オプションを渡してデータフレームに適用しますaxis=1。

In [1]: df['C'] = df.apply(f, axis=1)

In [2]: df
Out[2]:
   A  B  C
a  2  2  0
b  3  1  1
c  1  3 -1

もちろん、これはベクトル化されていないので、多数のレコードにスケーリングするとパフォーマンスはそれほど良くない可能性があります。それでも、はるかに読みやすくなっていると思います。特に SAS のバックグラウンドを持つ人にとってはそうです。

編集

こちらはベクトル化されたバージョンです

df['C'] = np.where(
    df['A'] == df['B'], 0, np.where(
    df['A'] >  df['B'], 1, -1))

おすすめ記事