将组合输出转换为 'dist' 类型的矩阵

Question

我有以下形式的数据框：

   dim1  dim2
1 Loc.1 0.325
2 Loc.2 0.325
3 Loc.3 0.321
4 Loc.4 0.256
5 Loc.5 0.255

我想计算 'dim2' 中两 (2) 个元素的每个组合的平均值；并将输出转换为矩阵；同时保留 'dim1'.

提供的信息

现在，我可以使用 combn 函数获得成对均值：

combn(tab[,2],2, mean)
[1] 0.3250 0.3230 0.2905 0.2900 0.3230 0.2905 0.2900 0.2885 0.2880 0.2555

但我希望它以类似矩阵的形式显示（这实际上与 class 'dist' 的对象非常相似，因为我希望它进一步分析）像这样：

        Loc.1   Loc.2   Loc.3   Loc.4
Loc.2   0.325           
Loc.3   0.323   0.323       
Loc.4   0.290   0.291   0.289   
Loc.5   0.290   0.290   0.288   0.256

（如您所见，我还需要信息 'Loc.x'）

我找不到可以直接在我的数据帧上进行成对计算的简单函数 'tab'。我可以使用 for 循环，但我觉得应该有更直接的方法。

有什么建议吗？非常感谢！

Answer 1

下面是一个相对简单的将向量转换为距离矩阵的方法：

vec <- c(0.3250, 0.3230, 0.2905, 0.2900, 0.3230, 0.2905, 0.2900, 0.2885, 0.2880, 0.2555)

mat <- matrix(nrow = 5, ncol = 5)
mat[lower.tri(mat)] <- vec
mat <- as.dist(mat)

#output
> mat
       1      2      3      4
2 0.3250                     
3 0.3230 0.3230              
4 0.2905 0.2905 0.2885       
5 0.2900 0.2900 0.2880 0.2555

Answer 2

这是使用 expand.grid 而不是 combn 的单行代码。

as.dist(matrix(apply(expand.grid(tab[, 2], tab[, 2]), 1, mean), 5, 5))
#       1      2      3      4
#2 0.3250
#3 0.3230 0.3230
#4 0.2905 0.2905 0.2885
#5 0.2900 0.2900 0.2880 0.2555

之所以可行，是因为expand.grid考虑了两个列向量tab[, 2]的所有可能组合，而combn遗漏了对角线元素；然后我们在组合矩阵上按行操作，计算均值，并首先将 vector 转换为 matrix，然后转换为 dist 对象。

Answer 3

您也可以使用outer函数。

dim2 <- as.numeric(tab$dim2)
names(dim2) <- tab$dim1
x <- outer(dim2, dim2, function(x,y) (x + y) / 2)
as.dist(x)
#        Loc.1  Loc.2  Loc.3  Loc.4
# Loc.2 0.3250                     
# Loc.3 0.3230 0.3230              
# Loc.4 0.2905 0.2905 0.2885       
# Loc.5 0.2900 0.2900 0.2880 0.2555

将组合输出转换为 'dist' 类型的矩阵

Convert combn output to matrix of type 'dist'

r

combn

pairwise