タイトルの通りです。潤滑機能はなぜこんなに遅いのでしょうか?
library(lubridate)
library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 50000, replace = TRUE)
microbenchmark(as.POSIXct(Dates, format = "%d-%b-%Y %H:%M:%S", tz = "GMT"), times = 100)
microbenchmark(dmy(Dates, tz ="GMT"), times = 100)
Unit: milliseconds
expr min lq median uq max
1 as.POSIXct(Dates, format = "%d-%b-%Y %H:%M:%S", tz = "GMT") 103.1902 104.3247 108.675 109.2632 149.871
2 dmy(Dates, tz = "GMT") 184.4871 194.1504 197.8422 214.3771 268.4911
ベストアンサー1
車が遅いのと同じ理由でロケットの上に乗る使いやすさと安全性が増したことにより、車はロケットよりはるかに遅くなりますが、爆発する可能性は少なくなり、車の始動、操縦、ブレーキが簡単になります。ただし、適切な状況 (たとえば、月に行く必要がある場合) では、ロケットは適切なツールです。誰かが屋根にロケットを取り付けた車を発明したら、何かが実現するでしょう。
まず何dmy
が行われているかを見てみると、速度の違いがわかります (ちなみに、ベンチマークではlubridate
ミリ秒単位なので、それほど遅いとは言えません)。
dmy
#これをコマンドラインに入力すると、次のようになります:
>dmy
function (..., quiet = FALSE, tz = "UTC")
{
dates <- unlist(list(...))
parse_date(num_to_date(dates), make_format("dmy"), quiet = quiet,
tz = tz)
}
<environment: namespace:lubridate>
すぐに、parse_date
とnum_to_date
とが目に入りますmake_format
。これらが一体何なのか不思議に思います。見てみましょう:
parse_date
> parse_date
function (x, formats, quiet = FALSE, seps = find_separator(x),
tz = "UTC")
{
fmt <- guess_format(head(x, 100), formats, seps, quiet)
parsed <- as.POSIXct(strptime(x, fmt, tz = tz))
if (length(x) > 2 & !quiet)
message("Using date format ", fmt, ".")
failed <- sum(is.na(parsed)) - sum(is.na(x))
if (failed > 0) {
message(failed, " failed to parse.")
}
parsed
}
<environment: namespace:lubridate>
num_to_date
> getAnywhere(num_to_date)
A single object matching ‘num_to_date’ was found
It was found in the following places
namespace:lubridate
with value
function (x)
{
if (is.numeric(x)) {
x <- as.character(x)
x <- paste(ifelse(nchar(x)%%2 == 1, "0", ""), x, sep = "")
}
x
}
<environment: namespace:lubridate>
make_format
> getAnywhere(make_format)
A single object matching ‘make_format’ was found
It was found in the following places
namespace:lubridate
with value
function (order)
{
order <- strsplit(order, "")[[1]]
formats <- list(d = "%d", m = c("%m", "%b"), y = c("%y",
"%Y"))[order]
grid <- expand.grid(formats, KEEP.OUT.ATTRS = FALSE, stringsAsFactors = FALSE)
lapply(1:nrow(grid), function(i) unname(unlist(grid[i, ])))
}
<environment: namespace:lubridate>
すごいですねstrsplit-ting
、、、、などに加えて、 Whole Lotta Error Checking Going On (Zep の曲を演奏)expand-ing.grid-s
もあります。つまり、これはすばらしい構文糖です。うーん、おいしいですが、代償として速度が伴います。paste-ing
ifelse-ing
unname-ing
それと比べて as.POSIXct
:
getAnywhere(as.POSIXct) #tells us to use methods to see the business
methods('as.POSIXct') #tells us all the business
as.POSIXct.date #what I believe your code is using (I don't use dates though)
内部コーディングが大幅に増加し、エラー チェックが少なくなっています。as.POSIXct
そのため、使いやすさと安全性を求めるのか、スピードとパワーを求めるのかを自問する必要があります。これは仕事によって異なります。