根据唯一值将列表拆分为子列表
Splitting List into sublists based on unique values
我有一个列表列表:
List<ArrayList<String>> D = new ArrayList<>();
填充后,它可能看起来像:
["A"、"B"、"Y"]
["C", "D", "Y"]
["A", "D", "N"]
我想根据唯一属性值(假设索引 1)将列表的列表拆分为多个分区。
所以索引 1 处的属性有两个唯一值,"B" 和 "D",所以我想拆分为:
["A"、"B"、"Y"]
["C", "D", "Y"]
["A"、"D"、"N"]
并将它们放入 List<ArrayList<ArrayList<String>>> sublists;
有没有聪明的方法可以做到这一点,或者我只是做这样的事情:
List<ArrayList<ArrayList<String>>> sublists = new ArrayList<>();
int featIdx = 1;
// generate the subsets
for (ArrayList<String> record : D) {
String val = record.get(featIdx);
// check if the value exists in sublists
boolean found = false;
for (ArrayList<ArrayList<String>> entry : sublists) {
if (entry.get(0).get(featIdx).equals(val)) {
entry.add(record);
found = true;
break;
}
}
if (!found) {
sublists.add(new ArrayList<>());
sublists.get(sublists.size()-1).add(record);
}
}
这是 C4.5 决策树 algorithm 的一个步骤,所以如果有人对此有经验,请告诉我这是否是生成子列表的正确方法,我将不胜感激。
谢谢。
我建议创建一个 HashMap<String, List<List<String>>>
,然后将这些列表分组。然后只需调用 map.values()
即可获得 Collection<List<List<String>>>
.
List<List<String>> list = new ArrayList<>();
list.add(Lists.newArrayList("A", "B", "Y"));
list.add(Lists.newArrayList("C", "D", "Z"));
list.add(Lists.newArrayList("A", "D", "X"));
list.add(Lists.newArrayList("D", "C", "A"));
Map<String, List<List<String>>> mapped = list.stream()
.collect(Collectors.groupingBy(li -> li.get(1)));
System.out.println(mapped);
Collection<List<List<String>>> groupedList = mapped.values();
使用 Java 8 你可以使用 groupingBy
收集器:
Map<String, List<List<String>>> grouped = D.stream()
.collect(Collectors.groupingBy(list -> list.get(1)));
Collection<List<List<String>>> sublists = grouped.values();
或按照@AlexisC 的建议:
import static java.util.stream.Collectors.collectingAndThen;
import static java.util.stream.Collectors.groupingBy;
Collection<List<List<String>>> sublists = D.stream()
.collect(collectingAndThen(groupingBy(list -> list.get(1)), Map::values));
我有一个列表列表:
List<ArrayList<String>> D = new ArrayList<>();
填充后,它可能看起来像:
["A"、"B"、"Y"]
["C", "D", "Y"]
["A", "D", "N"]
我想根据唯一属性值(假设索引 1)将列表的列表拆分为多个分区。
所以索引 1 处的属性有两个唯一值,"B" 和 "D",所以我想拆分为:
["A"、"B"、"Y"]
["C", "D", "Y"]
["A"、"D"、"N"]
并将它们放入 List<ArrayList<ArrayList<String>>> sublists;
有没有聪明的方法可以做到这一点,或者我只是做这样的事情:
List<ArrayList<ArrayList<String>>> sublists = new ArrayList<>();
int featIdx = 1;
// generate the subsets
for (ArrayList<String> record : D) {
String val = record.get(featIdx);
// check if the value exists in sublists
boolean found = false;
for (ArrayList<ArrayList<String>> entry : sublists) {
if (entry.get(0).get(featIdx).equals(val)) {
entry.add(record);
found = true;
break;
}
}
if (!found) {
sublists.add(new ArrayList<>());
sublists.get(sublists.size()-1).add(record);
}
}
这是 C4.5 决策树 algorithm 的一个步骤,所以如果有人对此有经验,请告诉我这是否是生成子列表的正确方法,我将不胜感激。
谢谢。
我建议创建一个 HashMap<String, List<List<String>>>
,然后将这些列表分组。然后只需调用 map.values()
即可获得 Collection<List<List<String>>>
.
List<List<String>> list = new ArrayList<>();
list.add(Lists.newArrayList("A", "B", "Y"));
list.add(Lists.newArrayList("C", "D", "Z"));
list.add(Lists.newArrayList("A", "D", "X"));
list.add(Lists.newArrayList("D", "C", "A"));
Map<String, List<List<String>>> mapped = list.stream()
.collect(Collectors.groupingBy(li -> li.get(1)));
System.out.println(mapped);
Collection<List<List<String>>> groupedList = mapped.values();
使用 Java 8 你可以使用 groupingBy
收集器:
Map<String, List<List<String>>> grouped = D.stream()
.collect(Collectors.groupingBy(list -> list.get(1)));
Collection<List<List<String>>> sublists = grouped.values();
或按照@AlexisC 的建议:
import static java.util.stream.Collectors.collectingAndThen;
import static java.util.stream.Collectors.groupingBy;
Collection<List<List<String>>> sublists = D.stream()
.collect(collectingAndThen(groupingBy(list -> list.get(1)), Map::values));