特定のパッケージ内のデータセットのリストを取得する 質問する

特定のパッケージ内のデータセットのリストを取得する 質問する

コンソールに表示される特定の R パッケージ内のすべてのデータ セットのリストを取得したいと思います。関数によって、data()ロードされたパッケージ内のすべてのデータ セットがリストされることはわかっています。それが私の目標ではありません。特定の R パッケージ内のすべてのデータ セットのリストを取得したいのですが、次の試みは機能しません。

data()
data('arules')
# Warning message:
# In data("arules") : data set ‘arules’ not found

dim私のもう一つの目的は、特定のパッケージ内のすべてのデータ セットのリストを取得することです。

ベストアンサー1

これについては、 の詳細セクションに良い情報がありますhelp(data)。ここでは、プライアパッケージを例に挙げます。まずは、 から何が利用できるかを見てみましょうdata()

names(data())
#[1] "title"   "header"  "results" "footer" 

これらの要素をさらに調査すると、その内容が明らかになります。次に、引数を使用してdata()結果のリストをサブセット化し、パッケージ内のデータ セットの名前を見つけることができます。

d <- data(package = "plyr")
## names of data sets in the package
d$results[, "Item"]
# [1] "baseball" "ozone"   
## assign it to use later
nm <- d$results[, "Item"]
## call the promised data
data(list = nm, package = "plyr")
## get the dimensions of each data set
lapply(mget(nm), dim)
# $baseball
# [1] 21699    22
#
# $ozone
# [1] 24 24 72

編集/更新:データセットの名前を検索する場合は、全てインストールされたパッケージについては、以下を使用できます。.packages(TRUE)ライブラリの場所パスで利用可能なすべてのパッケージを示しますlib.locベースそして統計パッケージはデータセットパッケージの場合は、 でそれらを削除してそれを考慮する必要がありますsetdiff()

## names of all packages sans base and stats
pkgs <- setdiff(.packages(TRUE), c("base", "stats"))
## get the names of all the data sets
dsets <- data(package = pkgs)$result[, "Item"]
## look at the first few in our result
head(dsets)
# [1] "AirPassengers"          "BJsales"                "BJsales.lead (BJsales)"
# [4] "BOD"                    "CO2"                    "ChickWeight"   

おすすめ記事