密度直方图的峰值分析 - R

Peak Analysis of Density Histogram - R

我正在使用 R 语言,我必须绘制两个样本的密度比较:

样本 1:

id1 2

id2 2

id3 2

id4 2

id5 2

id6 2

id7 3

id8 3

id9 3

id10 2

和样本 2:

id1 1

id2 1

id3 1

id4 1

id5 1

id6 1

id7 1

id8 2

id9 2

id10 1

第一列是 ID,第二列是该 ID 的值。

例如:

Id1 - 值。

Id2 - 值。

...

我使用以下代码绘制此图像:

library(ggplot2) 
library(sm)
library(scales)

x <- data.frame(read.table("C:/Users/Filli/Desktop/pasta/samples1.txt"), type = "Agregado")
y <- data.frame(read.table("C:/Users/Filli/Desktop/pasta/samples2.txt"), type = "Temporal")

data <- rbind(x,y)


print(ggplot( data, aes(x = V2, group = type)) +  geom_density(aes(fill= type), size=0, alpha=0.7))

http://prntscr.com/fdespg

我想要的是,如何找出每个密度(红色和蓝色)的峰的 ID?例如,在这种情况下,我想为每个密度(红色和蓝色)找到上图中红色矩形内包含的 id。我不想绘制红色矩形,它只是为了说明。我想要的是从每个峰(红色和蓝色)获取 id 并比较它们以查看 id 是否相同。考虑到每个密度只有一个大峰。我只想从每个峰中获取最大的 id(如上图)并比较它们以查看它们是否相同。

您可以使用基础 R density 函数,ggplot 用于密度图表。例如,要找到峰值的位置,您可以使用

density(data$V2)$x[which.max(density(data$V2)$y)]

有关详细信息,请参阅 ?density