20,000問目を記念してrStack OverflowのタグからRのリリース日を抽出するのを手伝ってくださいWikipediaページ。
私の試み:
library(XML)
x <- readHTMLTable("http://en.wikipedia.org/wiki/R_(programming_language)")
テーブルは実際には HTML テーブルではなくリストであるため、これは機能しません。
library(httr)
x <- GET("http://en.wikipedia.org/wiki/R_(programming_language)")
text <- content(x, "parsed")
これによりテキストが抽出されますが、私のはxpath
錆びているため、関連するリリース日を抽出できませんでした。
これどうやってするの?
PS. Wikipedia ページは私が見つけることができた唯一のソースですが、もしあれば、標準的なソースを使用した解決策を自由に投稿してください。
ベストアンサー1
ウィーンの標準的な FTP アーカイブのファイルの日付を使用しないのはなぜですか?
編集: 例
lynx -dump http://cran.r-project.org/src/base/R-0/ | grep tgz | grep -v http
R から解析できるテーブルを取得します。利点としてファイル サイズがわかります。R-1 および R-2 ディレクトリに対しても同じ手順を繰り返します。