使用 Linq 创建存储桶
Create Buckets ith Linq
我想在 List<double>
上创建 buckets,例如分成 n
组,例如:
List<double> list = new List<double>() {
0, 0.1, 1.1, 2.2, 3.3, 4.1, 5.6, 6.3, 7.1, 8.9, 9.8, 9.9, 10
};
n = 5
我想获得这样的东西
bucket values
---------------------------------
[0 .. 2] -> {0, 0.1, 1.1}
[2 .. 4] -> {2.2, 3.3}
...
[8 .. 10] -> {8.9, 9.8, 9.9, 10}
问题是如果我GroupBy
使用:
return items
.Select((item, inx) => new { item, inx })
.GroupBy(x => Math.Floor(x.item / step))
.Select(g => g.Select(x => x.item));
我总是得到不需要的第一个或最后一个桶,例如[10 .. 12]
(请注意,所有值都在 [0 .. 10]
范围内)或 [0 .. 0]
(请注意存储桶的 错误范围 ),其中包含 极端 值(上例中的 0
或 10
)。
任何帮助?
嗯,对于任意列表,你必须计算范围:[min..max]
然后
step = (max - min) / 2;
代码:
// Given
List<double> list = new List<double>() {
0, 0.1, 1.1, 2.2, 3.3, 4.1, 5.6, 6.3, 7.1, 8.9, 9.8, 9.9, 10
};
int n = 5;
// We compute step
double min = list.Min();
double max = list.Max();
double step = (max - min) / 5;
// And, finally, group by:
double[][] result = list
.GroupBy(item => (int)Math.Clamp((item - min) / step, 0, n - 1))
.OrderBy(group => group.Key)
.Select(group => group.ToArray())
.ToArray();
// Let's have a look:
string report = string.Join(Environment.NewLine, result
.Select((array, i) => $"[{min + i * step} .. {min + i * step + step,2}) : {{{string.Join("; ", array)}}}"));
Console.WriteLine(report);
结果:
[0 .. 2) : {0; 0.1; 1.1}
[2 .. 4) : {2.2; 3.3}
[4 .. 6) : {4.1; 5.6}
[6 .. 8) : {6.3; 7.1}
[8 .. 10) : {8.9; 9.8; 9.9; 10}
请注意 Math.Clamp
方法以确保组键的 [0..n-1]
范围。如果你想要 Dictionary<int, double[]>
其中 Key
是桶的索引:
Dictionary<int, double[]> buckets = list
.GroupBy(item => (int)Math.Clamp((item - min) / step, 0, n - 1))
.ToDictionary(group => group.Key, group => group.ToArray());
我想在 List<double>
上创建 buckets,例如分成 n
组,例如:
List<double> list = new List<double>() {
0, 0.1, 1.1, 2.2, 3.3, 4.1, 5.6, 6.3, 7.1, 8.9, 9.8, 9.9, 10
};
n = 5
我想获得这样的东西
bucket values
---------------------------------
[0 .. 2] -> {0, 0.1, 1.1}
[2 .. 4] -> {2.2, 3.3}
...
[8 .. 10] -> {8.9, 9.8, 9.9, 10}
问题是如果我GroupBy
使用:
return items
.Select((item, inx) => new { item, inx })
.GroupBy(x => Math.Floor(x.item / step))
.Select(g => g.Select(x => x.item));
我总是得到不需要的第一个或最后一个桶,例如[10 .. 12]
(请注意,所有值都在 [0 .. 10]
范围内)或 [0 .. 0]
(请注意存储桶的 错误范围 ),其中包含 极端 值(上例中的 0
或 10
)。
任何帮助?
嗯,对于任意列表,你必须计算范围:[min..max]
然后
step = (max - min) / 2;
代码:
// Given
List<double> list = new List<double>() {
0, 0.1, 1.1, 2.2, 3.3, 4.1, 5.6, 6.3, 7.1, 8.9, 9.8, 9.9, 10
};
int n = 5;
// We compute step
double min = list.Min();
double max = list.Max();
double step = (max - min) / 5;
// And, finally, group by:
double[][] result = list
.GroupBy(item => (int)Math.Clamp((item - min) / step, 0, n - 1))
.OrderBy(group => group.Key)
.Select(group => group.ToArray())
.ToArray();
// Let's have a look:
string report = string.Join(Environment.NewLine, result
.Select((array, i) => $"[{min + i * step} .. {min + i * step + step,2}) : {{{string.Join("; ", array)}}}"));
Console.WriteLine(report);
结果:
[0 .. 2) : {0; 0.1; 1.1}
[2 .. 4) : {2.2; 3.3}
[4 .. 6) : {4.1; 5.6}
[6 .. 8) : {6.3; 7.1}
[8 .. 10) : {8.9; 9.8; 9.9; 10}
请注意 Math.Clamp
方法以确保组键的 [0..n-1]
范围。如果你想要 Dictionary<int, double[]>
其中 Key
是桶的索引:
Dictionary<int, double[]> buckets = list
.GroupBy(item => (int)Math.Clamp((item - min) / step, 0, n - 1))
.ToDictionary(group => group.Key, group => group.ToArray());