R 中的 T 测试无法运行在一起

Question

我有一家航空公司 dataset 来自我正在尝试分析的统计计算。

有变量 DepTime 和 ArrDelay（出发时间和到达延迟）。我正在尝试分析到达延迟如何随出发时间的某些部分而变化。我的 objective 是找出一个人在订票时应该避开哪些时间段以避免到达延误

我的理解-如果出发时间>1800的到达延误和出发时间>1900的到达延误之间的单尾t检验显示出很高的显着性，这意味着应该避免1800到1900之间的航班。（请更正如果我错了我）。我想运行所有出发时间都进行此类测试。

** 对编程和数据科学完全陌生。任何帮助将不胜感激。

数据看起来像这样。突出显示的列是我正在分析的列

Answer 1

共享数据图像与提供数据供我们使用不同...

也就是说我去抓取了一年的数据并进行了处理。

flights <- read.csv("~/Downloads/1995.csv", header=T)

flights <- flights[, c("DepTime", "ArrDelay")]
flights$Dep <- round(flights$DepTime-30, digits = -2)
head(flights, n=25)

# This tests each hour of departures against the entire day. 
# Alternative is set to "less" because we want to know if a given hour
# has less delay than the day as a whole.

pVsDay <- tapply(flights$ArrDelay, flights$Dep, 
                 function(x) t.test(x, flights$ArrDelay, alternative = "less"))

# This tests each hour of departures against every other hour of the day. 
# Alternative is set to "less" because we want to know if a given hour
# has less delay than the other hours.
pAllvsAll <- tapply(flights$ArrDelay, flights$Dep, 
                           function(x) tapply(flights$ArrDelay, flights$Dep, function (z) 
                             t.test(x, z, alternative = "less")))

我会让你想出多重假设检验之类的。

R 中的 T 测试无法运行在一起

T tests in R- unable to run together

statistics

r

data-science

t-test

全部对全部

R 中的 T 测试无法 运行 在一起

T tests in R- unable to run together

statistics

r

data-science

t-test

全部对全部

R 中的 T 测试无法运行在一起