创建基于另一个向量的重复值上升的向量 (MATLAB)
Create vector which ascends based on repeated values of another vector (MATLAB)
这是一个相对简单的。假设我有以下向量 ('V1'):
1
1
1
2
2
2
2
3
3
4
4
4
4
5
5
5
我想创建第二个向量 V2,它从 1 开始并随着 V1 中值的每次迭代而增加,但随后重置为 V1 的新值。例如:
1
2
3
1
2
3
4
1
2
1
2
3
4
1
2
3
V1 中的值可能有单次迭代,或多达 6 次。
解决方案可能使用 for 循环,但我想有一种更简单的形式不需要循环(想到 'repmat')。
v = [1;1;1;2;2;2;2;3;3;4;4;4;4;5;5;5];
a= v;
for i=unique(v)'
a(v==i)= 1:length(a(v==i));
end
disp(a)
没有循环的解决方案
vec =[1 1 1 2 2 2 3 3 3];
zero_separated=[1,vec(1:end-1)==vec(2:end)]; % 0 at every new set
c=cumsum(zero_separated); % Temporary cumsum
zeros_ind = ~zero_separated;
d = diff([1 c(zeros_ind)]); % deltas in the temporary cumsum
zero_separated(zeros_ind) = -d; % Set zeros ind to delta
output=cumsum(zero_separated); % Calculate cumsum now
输出
output = 1 2 3 1 2 3 1 2 3
基于this
假设 V1
已排序,这是使用 accumarray
的向量化解决方案:
V2 = accumarray(V1, 1, [], @(x) {1:numel(x)});
V2 = [V2{:}].';
另一个没有循环的建议。
先统计重复值的个数
a=histc(v1,unique(v1));
构造计数数组
b = ones(1,sum(a));
现在将计数器的累计和放在合适的地方:
a = a(1:end-1);
b(cumsum(a)+1) = b(cumsum(a)+1) - a;
最后取总和
cumsum(b)
总计
v1 = [1,1,1,1,2,2,3,3,3,3,3,4];
a=histcounts(v1,[unique(v1),inf]);
b = ones(1,sum(a));
a = a(1:end-1);
b(cumsum(a)+1) = b(cumsum(a)+1) - a;
disp(cumsum(b))
时间:
运行 随机排序输入 V1 = sort(randi(100,1e6,1));
我在 Matlab 2017a 中获得了以下计时。
- Gnovic 的第一个建议:2.852872e-02
- Gnovic 的第二个建议:2.909344e-02
- AVK的建议:3.935982e-01
- RadioJava 的建议:2.441206e-02
- 尼基的建议:9.153147e-03
参考代码:
function [] = SO()
V1 = sort(randi(100,1e6,1));
t1 = timeit(@() gnovice1(V1)); fprintf("* Gnovic's first suggestion: %d\n",t1);
t2 = timeit(@() gnovice2(V1)); fprintf("* Gnovic's second suggestion: %d\n",t2);
t3 = timeit(@() AVK(V1)); fprintf("* AVK's suggestion: %d\n",t3);
t4 = timeit(@() RadioJava(V1)); fprintf("* RadioJava's suggestion: %d\n",t4);
t5 = timeit(@() Nicky(V1)); fprintf("* Nicky's suggestion: %d\n",t5);
function []=gnovice1(V1)
V2 = accumarray(V1, 1, [], @(x) {1:numel(x)});
V2 = [V2{:}].';
function []=gnovice2(V1)
V2 = ones(size(V1));
V2([find(diff(V1))+1; end]) = 1-accumarray(V1, 1);
V2 = cumsum(V2(1:end-1));
function []=AVK(v)
a= v;
for i=unique(v)'
a(v==i)= 1:length(a(v==i));
end
function []=RadioJava(vec)
vec = vec(:).';
zero_separated=[1,vec(1:end-1)==vec(2:end)];
c=cumsum(zero_separated);
zeros_ind = ~zero_separated;
d = diff([1 c(zeros_ind)]);
zero_separated(zeros_ind) = -d;
output=cumsum(zero_separated);
function []=Nicky(v1)
v1 = v1(:).';
a=histcounts(v1,[unique(v1),inf]);
b = ones(1,sum(a));
a = a(1:end-1);
b(cumsum(a)+1) = b(cumsum(a)+1) - a;
b = cumsum(b);
基于this answer中的第二种方法:
t = diff([0; find([diff(V1)~=0; true])]);
V2 = ones(sum(t), 1);
V2(cumsum(t(1:end-1))+1) = 1-t(1:end-1);
V2 = cumsum(V2);
这是一个相对简单的。假设我有以下向量 ('V1'):
1
1
1
2
2
2
2
3
3
4
4
4
4
5
5
5
我想创建第二个向量 V2,它从 1 开始并随着 V1 中值的每次迭代而增加,但随后重置为 V1 的新值。例如:
1
2
3
1
2
3
4
1
2
1
2
3
4
1
2
3
V1 中的值可能有单次迭代,或多达 6 次。
解决方案可能使用 for 循环,但我想有一种更简单的形式不需要循环(想到 'repmat')。
v = [1;1;1;2;2;2;2;3;3;4;4;4;4;5;5;5];
a= v;
for i=unique(v)'
a(v==i)= 1:length(a(v==i));
end
disp(a)
没有循环的解决方案
vec =[1 1 1 2 2 2 3 3 3];
zero_separated=[1,vec(1:end-1)==vec(2:end)]; % 0 at every new set
c=cumsum(zero_separated); % Temporary cumsum
zeros_ind = ~zero_separated;
d = diff([1 c(zeros_ind)]); % deltas in the temporary cumsum
zero_separated(zeros_ind) = -d; % Set zeros ind to delta
output=cumsum(zero_separated); % Calculate cumsum now
输出
output = 1 2 3 1 2 3 1 2 3
基于this
假设 V1
已排序,这是使用 accumarray
的向量化解决方案:
V2 = accumarray(V1, 1, [], @(x) {1:numel(x)});
V2 = [V2{:}].';
另一个没有循环的建议。
先统计重复值的个数
a=histc(v1,unique(v1));
构造计数数组
b = ones(1,sum(a));
现在将计数器的累计和放在合适的地方:
a = a(1:end-1);
b(cumsum(a)+1) = b(cumsum(a)+1) - a;
最后取总和
cumsum(b)
总计
v1 = [1,1,1,1,2,2,3,3,3,3,3,4];
a=histcounts(v1,[unique(v1),inf]);
b = ones(1,sum(a));
a = a(1:end-1);
b(cumsum(a)+1) = b(cumsum(a)+1) - a;
disp(cumsum(b))
时间:
运行 随机排序输入 V1 = sort(randi(100,1e6,1));
我在 Matlab 2017a 中获得了以下计时。
- Gnovic 的第一个建议:2.852872e-02
- Gnovic 的第二个建议:2.909344e-02
- AVK的建议:3.935982e-01
- RadioJava 的建议:2.441206e-02
- 尼基的建议:9.153147e-03
参考代码:
function [] = SO()
V1 = sort(randi(100,1e6,1));
t1 = timeit(@() gnovice1(V1)); fprintf("* Gnovic's first suggestion: %d\n",t1);
t2 = timeit(@() gnovice2(V1)); fprintf("* Gnovic's second suggestion: %d\n",t2);
t3 = timeit(@() AVK(V1)); fprintf("* AVK's suggestion: %d\n",t3);
t4 = timeit(@() RadioJava(V1)); fprintf("* RadioJava's suggestion: %d\n",t4);
t5 = timeit(@() Nicky(V1)); fprintf("* Nicky's suggestion: %d\n",t5);
function []=gnovice1(V1)
V2 = accumarray(V1, 1, [], @(x) {1:numel(x)});
V2 = [V2{:}].';
function []=gnovice2(V1)
V2 = ones(size(V1));
V2([find(diff(V1))+1; end]) = 1-accumarray(V1, 1);
V2 = cumsum(V2(1:end-1));
function []=AVK(v)
a= v;
for i=unique(v)'
a(v==i)= 1:length(a(v==i));
end
function []=RadioJava(vec)
vec = vec(:).';
zero_separated=[1,vec(1:end-1)==vec(2:end)];
c=cumsum(zero_separated);
zeros_ind = ~zero_separated;
d = diff([1 c(zeros_ind)]);
zero_separated(zeros_ind) = -d;
output=cumsum(zero_separated);
function []=Nicky(v1)
v1 = v1(:).';
a=histcounts(v1,[unique(v1),inf]);
b = ones(1,sum(a));
a = a(1:end-1);
b(cumsum(a)+1) = b(cumsum(a)+1) - a;
b = cumsum(b);
基于this answer中的第二种方法:
t = diff([0; find([diff(V1)~=0; true])]);
V2 = ones(sum(t), 1);
V2(cumsum(t(1:end-1))+1) = 1-t(1:end-1);
V2 = cumsum(V2);