密度直方图的峰值分析 - R

Question

我正在使用 R 语言，我必须绘制两个样本的密度比较：

样本 1:

id1 2

id2 2

id3 2

id4 2

id5 2

id6 2

id7 3

id8 3

id9 3

id10 2

和样本 2：

id1 1

id2 1

id3 1

id4 1

id5 1

id6 1

id7 1

id8 2

id9 2

id10 1

第一列是 ID，第二列是该 ID 的值。

例如：

Id1 - 值。

Id2 - 值。

...

请注意，这两个样本具有相同的大小和相同的 ID，但值不同。

我使用以下代码绘制此图像：

library(ggplot2) 
library(sm)
library(scales)

x <- data.frame(read.table("C:/Users/Filli/Desktop/pasta/samples1.txt"), type = "Agregado")
y <- data.frame(read.table("C:/Users/Filli/Desktop/pasta/samples2.txt"), type = "Temporal")

data <- rbind(x,y)


print(ggplot( data, aes(x = V2, group = type)) +  geom_density(aes(fill= type), size=0, alpha=0.7))

http://prntscr.com/fdespg

我想要的是，如何找出每个密度（红色和蓝色）的峰的 ID？例如，在这种情况下，我想为每个密度（红色和蓝色）找到上图中红色矩形内包含的 id。我不想绘制红色矩形，它只是为了说明。我想要的是从每个峰（红色和蓝色）获取 id 并比较它们以查看 id 是否相同。考虑到每个密度只有一个大峰。我只想从每个峰中获取最大的 id（如上图）并比较它们以查看它们是否相同。

Answer 1

您可以使用基础 R density 函数，ggplot 用于密度图表。例如，要找到峰值的位置，您可以使用

density(data$V2)$x[which.max(density(data$V2)$y)]

有关详细信息，请参阅 ?density。

密度直方图的峰值分析 - R

Peak Analysis of Density Histogram - R

r

density-plot