使用 accumarray 按索引对行求和

Summing rows by index using accumarray

我可以在不使用 for 循环的情况下对多个索引的行或列求和吗?

我有一个 n x n 矩阵,M,表示词汇术语的共现,其中 n 是词汇的长度。

我还有一个 n 乘 n 的逻辑掩码,L,它表示词汇对的形式为(单数、复数)。例如,在伪代码中,L('octopus', 'octopuses') = True

我想将 M 中包含复数的任何对的条目添加到包含相应单数的对的条目。例如,在伪代码中,M_sum('octopus', 'swim') = M('octopus', 'swim') + M('octopuses', 'swim');

为了说明我到目前为止所做的尝试,让我们使用以下玩具数据。

vocabulary = {'octopus', 'octopuses', 'swim'};
% The co-occurrence matrix is symmetric
M = [0, 9, 3; 
     9, 0, 1;  
     3, 1, 0;];
% This example has only one plural singular pair
L = [0, 1, 0; 
     0, 0, 0; 
     0, 0, 0;];  

要找到单复数的对应关系,我可以使用 find

[singular, plural] = find(L == 1);

如果每个单数只有一个复数,则对行或列求和很简单

M_sum = M;
M_sum(singular, :) = M_sum(singular, :) + M(plural, :);
M_sum(:, singular) = M_sum(:, singular) + M(:, plural);
% Remove diagonal entries
M_sum(eye(size(M))==1) = 0; 

但是,如果有多个复数对应一个单数,则不能使用此方法。

例如,

vocabulary = {'octopus', 'octopuses', 'octopi', 'swim'};
M = [0, 9, 5, 3; 
     9, 0, 7, 1; 
     5, 7, 0, 11; 
     3, 1, 11, 0;];
L = [0, 1, 1, 0; 
     0, 0, 0, 0; 
     0, 0, 0, 0; 
     0, 0, 0, 0;];  

正确答案应该是

M_sum = [0, 16, 12, 15;
         16, 0, 7, 1;
         12, 7, 0, 11;
         15, 1, 11, 0;];

但是用上面的方法returns

M_sum = [0, 16, 5, 14;
         16, 0, 7, 1;
         5, 7, 0, 11;
         14, 1, 11, 0;];

基本上,M_sum(singular, :) = M_sum(singular, :) + M(plural, :); 只使用最后一个 plural 索引。

我想我需要在这里使用 accumarray,但是我在制定正确的语句时遇到了一些问题,因为我有两个索引,pluralsingular。如果accumarray不是正确的方法,也欢迎其他解决方案。

试试这个:

M_sum = (L + eye(size(L,1)))*M;
M_sum = triu(M_sum, 1);
M_sum = M_sum + M_sum.';

这是可行的,因为您已经有了矩阵 L,因此矩阵乘法可用于 select 并对 M 的行求和。


在这里使用 accumarray 有两个缺点:

  • 您需要应用 findL 转换为索引以用作 accumarray 的第一个输入。所以再走一步。
  • accumarray只能求和,不能求和行向量(它的第二个输入只能是列向量,不能矩阵)。因此,您需要为 M.
  • 的每列调用一次 accumarray