`[` は `subset` よりも優れているのはなぜですか? 質問する

Question

この質問は@Jamesのコメントでうまく答えられており、Hadley Wickhamによる危険性subset（および同様の機能）についての優れた説明が示されています。[ここ]ぜひ読んでみてください！

少し長いので、Hadley が「何が問題になるのか?」という質問に最も直接的に答えている例をここに記録しておくと役立つかもしれません。

Hadley は次の例を提案しています。次の関数を使用してデータフレームをサブセット化し、並べ替えたいとします。

scramble <- function(x) x[sample(nrow(x)), ]

subscramble <- function(x, condition) {
  scramble(subset(x, condition))
}

subscramble(mtcars, cyl == 4)

次のエラーが返されます:

eval(expr, envir, enclos) でエラーが発生しました: オブジェクト 'cyl' が見つかりません

なぜなら、R はもはや 'cyl' というオブジェクトがどこにあるかを「知らない」からです。彼はまた、偶然にグローバル環境に 'cyl' というオブジェクトがある場合に発生する可能性のある、実に奇妙な事柄についても指摘しています。

cyl <- 4
subscramble(mtcars, cyl == 4)

cyl <- sample(10, 100, rep = T)
subscramble(mtcars, cyl == 4)

(実行して自分で確かめてください。かなりすごいですよ。)

Answer 1