编织一个 HTML 文件不会发布推理命令
Knitting an HTML file wont publish the inference command
我目前正在学习 R 课程,但我正在努力编织一个 HTML 文件。
所有代码在 RStudio 中运行良好。该文件也可以正确编织,但是当我 运行 推理时,它不会为最后一个命令绘制输出。我添加了代码。
非常感谢任何意见。
谢谢
马库斯
首先,我们过滤宗教和感兴趣的年份:
```{r 过滤器}
gss2012 = gss %>%
filter(year =="2012")
gssCatPro2012 = gss2012 %>%
filter(relig=="Catholic" | relig=="Protestant")
```
现在我们创建两个宗教的第一个直方图以初步了解分布:
{r plot both rel}
ggplot(data=gssCatPro2012, aes(x=childs))+geom_histogram()
计算比率并在饼图中表示:
{r ratio}
gssCatPro2012 %>%
summarise(Catholicratio = sum(relig =="Catholic")/n())
percent <- c(32.64,67.36)
lbls <- c("Catholics", "Protestants")
pct <- round(percent/sum(percent)*100)
lbls <- paste(lbls, pct)
lbls <- paste(lbls,"%", sep="")
pie(percent, labels=lbls, col=rainbow(length(lbls)), main="Pie chart Catholics/Protestants")
在宗教之间拆分数据:
{r split}
gssCat2012 = gssCatPro2012 %>%
filter(relig=="Catholic")
gssPro2012 = gssCatPro2012 %>%
filter(relig=="Protestant")
首先绘制天主教徒分布图,然后绘制新教徒分布图:
{r plot per religion}
ggplot(data=gssCat2012, aes(x=childs))+geom_histogram()
ggplot(data=gssPro2012, aes(x=childs))+geom_histogram()
检查是否有任何 NA 需要清理:
{r NA}
anyNA(gssCatPro2012$childs)
completeFun <- function(data, desiredCols) {
completeVec <- complete.cases(data[, desiredCols])
return(data[completeVec, ])
}
gssCatPro2012=completeFun(gssCatPro2012,"childs")
anyNA(gssCatPro2012$childs)
计算两种宗教的均值:
{r metrics}
gssCatPro2012 %>%
group_by(relig) %>%
summarise(mean_kids=mean(childs), med_kids=median(childs), sd_kids=sd(childs),n=n())
推理
我们将创建一个新变量以覆盖旧变量 relig 的内容:
{create new variable}
gssCatPro2012new <- gssCatPro2012 %>%
mutate(relignew = ifelse(relig == "Catholic", "Catholic", "Protestant"))
现在,我们可以 运行 推理函数,看看我们是否可以拒绝 0 假设:
{hypothesis test}
inference(y = childs, x = relignew, data = gssCatPro2012new, statistic = "mean", type = "ht", null = 0, alternative = "twosided", method = "theoretical")
修改块名称以使用下划线而不是空格,并确保每个块都以前导 "r".
开头
例如:
{r create_new_variable}
而不是:
{create new variable}
我目前正在学习 R 课程,但我正在努力编织一个 HTML 文件。 所有代码在 RStudio 中运行良好。该文件也可以正确编织,但是当我 运行 推理时,它不会为最后一个命令绘制输出。我添加了代码。
非常感谢任何意见。 谢谢 马库斯
首先,我们过滤宗教和感兴趣的年份:
```{r 过滤器}
gss2012 = gss %>%
filter(year =="2012")
gssCatPro2012 = gss2012 %>%
filter(relig=="Catholic" | relig=="Protestant")
```
现在我们创建两个宗教的第一个直方图以初步了解分布:
{r plot both rel}
ggplot(data=gssCatPro2012, aes(x=childs))+geom_histogram()
计算比率并在饼图中表示:
{r ratio}
gssCatPro2012 %>%
summarise(Catholicratio = sum(relig =="Catholic")/n())
percent <- c(32.64,67.36)
lbls <- c("Catholics", "Protestants")
pct <- round(percent/sum(percent)*100)
lbls <- paste(lbls, pct)
lbls <- paste(lbls,"%", sep="")
pie(percent, labels=lbls, col=rainbow(length(lbls)), main="Pie chart Catholics/Protestants")
在宗教之间拆分数据:
{r split}
gssCat2012 = gssCatPro2012 %>%
filter(relig=="Catholic")
gssPro2012 = gssCatPro2012 %>%
filter(relig=="Protestant")
首先绘制天主教徒分布图,然后绘制新教徒分布图:
{r plot per religion}
ggplot(data=gssCat2012, aes(x=childs))+geom_histogram()
ggplot(data=gssPro2012, aes(x=childs))+geom_histogram()
检查是否有任何 NA 需要清理:
{r NA}
anyNA(gssCatPro2012$childs)
completeFun <- function(data, desiredCols) {
completeVec <- complete.cases(data[, desiredCols])
return(data[completeVec, ])
}
gssCatPro2012=completeFun(gssCatPro2012,"childs")
anyNA(gssCatPro2012$childs)
计算两种宗教的均值:
{r metrics}
gssCatPro2012 %>%
group_by(relig) %>%
summarise(mean_kids=mean(childs), med_kids=median(childs), sd_kids=sd(childs),n=n())
推理
我们将创建一个新变量以覆盖旧变量 relig 的内容:
{create new variable}
gssCatPro2012new <- gssCatPro2012 %>%
mutate(relignew = ifelse(relig == "Catholic", "Catholic", "Protestant"))
现在,我们可以 运行 推理函数,看看我们是否可以拒绝 0 假设:
{hypothesis test}
inference(y = childs, x = relignew, data = gssCatPro2012new, statistic = "mean", type = "ht", null = 0, alternative = "twosided", method = "theoretical")
修改块名称以使用下划线而不是空格,并确保每个块都以前导 "r".
开头例如:
{r create_new_variable}
而不是:
{create new variable}