Matlab:如果索引在一个范围内,则对相应的值求和

Matlab: Sum corresponding values if index is within a range

我一直在疯狂地想办法加快速度。现在我当前的代码在 77000 个事件上循环约 200 秒。我希望有人可以帮助我加快速度,因为我必须做大约 500 个这样的事情。

问题: 我有数组(均为 200000x1),对应于超过 77000 个事件的能量和位置。我将每个事件的范围分成两个数组,event_start 和 event_end。我首先要做的是在特定范围内寻找位置,然后将相应的能量放入自己的数组中。为了从这些信息中获得我需要的信息,我循环遍历每个事件及其对应的 start/end 以总结每个事件的所有能量。我的代码如下:

    indx_pos = find(pos>0.7 & pos<2.0);
    energy = HitEnergy(indx_pos);

    for i=1:n_events
        Etotal(i) = sum(energy(find(indx_pos>=event_start(i) …
        & indx_pos<=event_end(i))));    
    end

示例输入和输出:

% Sample input 
% pos and energy same length

n_events = 3;
event_start = [1 3 7]';
event_end   = [2 6 8]';

pos = [0.75 0.8 2.1 3.6 1.9 0.5 21.0 3.1]';
HitEnergy = [0.002 0.004 0.01 0.0005 0.08  0.1 1.7 0.007]';


%  Sample Output
Etotal = 0.0060
         0.0800
              0

方法 #1:一般情况

bsxfunmatrix-multiplication 的一种方法 -

mask = bsxfun(@ge,indx_pos,event_start.') & bsxfun(@le,indx_pos,event_end.')
Etotal = energy.'*mask

如果 indx_pos 中有很多元素,这可能有点 memory-hungry


方法 #2:非重叠 start/end 范围案例

对于这种特殊情况,可以使用 accumarray -

%// Setup ID array for use in accumarray later on
loc(numel(pos))=0; %// Fast pre-allocation scheme
valids = event_end+1<=numel(pos);
loc(event_end(valids)+1) = -1*(1:sum(valids));
loc(event_start) = loc(event_start)+(1:numel(event_end));
id = cumsum(loc);

%// Set elements as zeros in HitEnergy that do not satisfy the criteria:
%// pos>0.7 & pos<2.0
HitEnergy_select = (pos>0.7 & pos<2.0).*HitEnergy(:);

%// Discard elments in HitEnergy_select & id that have IDs as zeros  
HitEnergy_select = HitEnergy_select(id~=0);
id = id(id~=0);

%// Accumulate summations as done inside the loop in the original code 
Etotal = accumarray(id(:),HitEnergy_select);

问题在于,对于每个事件,您都在搜索整个向量 indx_pos。 将循环内的搜索限制在从 event_start(i)event_end(i):

的范围内
for i = 1:n_events
    I = event_start(i):event_end(i);
    posIIsWithinRange = pos(I)>0.7 & pos(I)<2.0;
    Etotal(i) = sum(HitEnergy(I(posIIsWithinRange)));
end

您还可以使用基于 and vectorizing the notion of colon 的矢量化版本。 (下载函数 coloncatrldrunLengthDecode。)

I = coloncatrld(event_start, event_end);
energy = HitEnergy(I);
eventNum = runLengthDecode(event_end - event_start+1);
posIIsWithinRange = pos(I)>0.7 & pos(I)<2.0;
Etotal = accumarray(eventNum(posIIsWithinRange), energy(posIIsWithinRange), [n_events,1]);

这类似于 Divakar 的方法 #2,此外它也适用于重叠范围。