Java 8 中流的笛卡尔积作为流(仅使用流)
Cartesian product of streams in Java 8 as stream (using streams only)
我想创建一个方法来创建一个元素流,这些元素是多个给定流的笛卡尔积(最后由二元运算符聚合为相同类型)。请注意,参数和结果都是流,不是集合。
例如,对于 {A, B} 和 {X, Y} 两个流,我希望它产生流values {AX, AY, BX, BY}(简单的连接用于聚合字符串)。到目前为止,我想出了这个代码:
private static <T> Stream<T> cartesian(BinaryOperator<T> aggregator, Stream<T>... streams) {
Stream<T> result = null;
for (Stream<T> stream : streams) {
if (result == null) {
result = stream;
} else {
result = result.flatMap(m -> stream.map(n -> aggregator.apply(m, n)));
}
}
return result;
}
这是我想要的用例:
Stream<String> result = cartesian(
(a, b) -> a + b,
Stream.of("A", "B"),
Stream.of("X", "Y")
);
System.out.println(result.collect(Collectors.toList()));
预期结果:AX, AY, BX, BY
.
另一个例子:
Stream<String> result = cartesian(
(a, b) -> a + b,
Stream.of("A", "B"),
Stream.of("K", "L"),
Stream.of("X", "Y")
);
预期结果:AKX, AKY, ALX, ALY, BKX, BKY, BLX, BLY
.
但是,如果我 运行 代码,我会得到这个错误:
IllegalStateException: 流已被操作或关闭
流在哪里消费?通过 flatMap?可以轻松修复吗?
stream
在第二次迭代的flatMap
操作中消耗。因此,每次 map
结果时都必须创建一个新流。因此,您必须提前收集 stream
才能在每次迭代中获得新流。
private static <T> Stream<T> cartesian(BiFunction<T, T, T> aggregator, Stream<T>... streams) {
Stream<T> result = null;
for (Stream<T> stream : streams) {
if (result == null) {
result = stream;
} else {
Collection<T> s = stream.collect(Collectors.toList());
result = result.flatMap(m -> s.stream().map(n -> aggregator.apply(m, n)));
}
}
return result;
}
或更短:
private static <T> Stream<T> cartesian(BiFunction<T, T, T> aggregator, Stream<T>... streams) {
return Arrays.stream(streams).reduce((r, s) -> {
List<T> collect = s.collect(Collectors.toList());
return r.flatMap(m -> collect.stream().map(n -> aggregator.apply(m, n)));
}).orElse(Stream.empty());
}
在您的示例中传递流永远不会比传递列表更好:
private static <T> Stream<T> cartesian(BinaryOperator<T> aggregator, List<T>... lists) {
...
}
并像这样使用它:
Stream<String> result = cartesian(
(a, b) -> a + b,
Arrays.asList("A", "B"),
Arrays.asList("K", "L"),
Arrays.asList("X", "Y")
);
在这两种情况下,您都从可变参数创建隐式数组并将其用作数据源,因此惰性是虚构的。您的数据实际上存储在数组中。
在大多数情况下,生成的笛卡尔积流比输入长得多,因此实际上没有理由使输入惰性化。例如,有五个包含五个元素的列表(总共 25 个),您将得到包含 3125 个元素的结果流。所以在内存中存储 25 个元素不是很大的问题。实际上在大多数实际情况下它们已经存储在内存中。
为了生成笛卡尔积流,您需要不断 "rewind" 所有流(第一个流除外)。要倒回,流应该能够一次又一次地检索原始数据,或者以某种方式缓冲它们(你不喜欢)或者从源(集合、数组、文件、网络、随机数等)中再次抓取它们。 ) 并一次又一次地执行所有中间操作。如果您的源和中间操作很慢,那么惰性解决方案可能比缓冲解决方案慢得多。如果您的来源无法再次生成数据(例如,随机数生成器无法生成与之前生成的相同的数字),您的解决方案将是不正确的。
然而,完全懒惰的解决方案是可能的。不使用流,而是使用流供应商:
private static <T> Stream<T> cartesian(BinaryOperator<T> aggregator,
Supplier<Stream<T>>... streams) {
return Arrays.stream(streams)
.reduce((s1, s2) ->
() -> s1.get().flatMap(t1 -> s2.get().map(t2 -> aggregator.apply(t1, t2))))
.orElse(Stream::empty).get();
}
这个解决方案很有趣,因为我们创建并减少供应商流以获取最终供应商并最终调用它。用法:
Stream<String> result = cartesian(
(a, b) -> a + b,
() -> Stream.of("A", "B"),
() -> Stream.of("K", "L"),
() -> Stream.of("X", "Y")
);
result.forEach(System.out::println);
您可以创建一个 returns List<T>
对象流并且不聚合它们的方法。算法是相同的:在每一步中,将第二个流的元素收集到一个列表中,然后将它们附加到第一个流的元素中。
聚合器在方法之外。
@SuppressWarnings("unchecked")
public static <T> Stream<List<T>> cartesianProduct(Stream<T>... streams) {
// incorrect incoming data
if (streams == null) return Stream.empty();
return Arrays.stream(streams)
// non-null streams
.filter(Objects::nonNull)
// represent each list element as SingletonList<Object>
.map(stream -> stream.map(Collections::singletonList))
// summation of pairs of inner lists
.reduce((stream1, stream2) -> {
// list of lists from second stream
List<List<T>> list2 = stream2.collect(Collectors.toList());
// append to the first stream
return stream1.flatMap(inner1 -> list2.stream()
// combinations of inner lists
.map(inner2 -> {
List<T> list = new ArrayList<>();
list.addAll(inner1);
list.addAll(inner2);
return list;
}));
}).orElse(Stream.empty());
}
public static void main(String[] args) {
Stream<String> stream1 = Stream.of("A", "B");
Stream<String> stream2 = Stream.of("K", "L");
Stream<String> stream3 = Stream.of("X", "Y");
@SuppressWarnings("unchecked")
Stream<List<String>> stream4 = cartesianProduct(stream1, stream2, stream3);
// output
stream4.map(list -> String.join("", list)).forEach(System.out::println);
}
String.join
在这种情况下是一种聚合器。
输出:
AKX
AKY
ALX
ALY
BKX
BKY
BLX
BLY
另请参阅:
我想创建一个方法来创建一个元素流,这些元素是多个给定流的笛卡尔积(最后由二元运算符聚合为相同类型)。请注意,参数和结果都是流,不是集合。
例如,对于 {A, B} 和 {X, Y} 两个流,我希望它产生流values {AX, AY, BX, BY}(简单的连接用于聚合字符串)。到目前为止,我想出了这个代码:
private static <T> Stream<T> cartesian(BinaryOperator<T> aggregator, Stream<T>... streams) {
Stream<T> result = null;
for (Stream<T> stream : streams) {
if (result == null) {
result = stream;
} else {
result = result.flatMap(m -> stream.map(n -> aggregator.apply(m, n)));
}
}
return result;
}
这是我想要的用例:
Stream<String> result = cartesian(
(a, b) -> a + b,
Stream.of("A", "B"),
Stream.of("X", "Y")
);
System.out.println(result.collect(Collectors.toList()));
预期结果:AX, AY, BX, BY
.
另一个例子:
Stream<String> result = cartesian(
(a, b) -> a + b,
Stream.of("A", "B"),
Stream.of("K", "L"),
Stream.of("X", "Y")
);
预期结果:AKX, AKY, ALX, ALY, BKX, BKY, BLX, BLY
.
但是,如果我 运行 代码,我会得到这个错误:
IllegalStateException: 流已被操作或关闭
流在哪里消费?通过 flatMap?可以轻松修复吗?
stream
在第二次迭代的flatMap
操作中消耗。因此,每次 map
结果时都必须创建一个新流。因此,您必须提前收集 stream
才能在每次迭代中获得新流。
private static <T> Stream<T> cartesian(BiFunction<T, T, T> aggregator, Stream<T>... streams) {
Stream<T> result = null;
for (Stream<T> stream : streams) {
if (result == null) {
result = stream;
} else {
Collection<T> s = stream.collect(Collectors.toList());
result = result.flatMap(m -> s.stream().map(n -> aggregator.apply(m, n)));
}
}
return result;
}
或更短:
private static <T> Stream<T> cartesian(BiFunction<T, T, T> aggregator, Stream<T>... streams) {
return Arrays.stream(streams).reduce((r, s) -> {
List<T> collect = s.collect(Collectors.toList());
return r.flatMap(m -> collect.stream().map(n -> aggregator.apply(m, n)));
}).orElse(Stream.empty());
}
在您的示例中传递流永远不会比传递列表更好:
private static <T> Stream<T> cartesian(BinaryOperator<T> aggregator, List<T>... lists) {
...
}
并像这样使用它:
Stream<String> result = cartesian(
(a, b) -> a + b,
Arrays.asList("A", "B"),
Arrays.asList("K", "L"),
Arrays.asList("X", "Y")
);
在这两种情况下,您都从可变参数创建隐式数组并将其用作数据源,因此惰性是虚构的。您的数据实际上存储在数组中。
在大多数情况下,生成的笛卡尔积流比输入长得多,因此实际上没有理由使输入惰性化。例如,有五个包含五个元素的列表(总共 25 个),您将得到包含 3125 个元素的结果流。所以在内存中存储 25 个元素不是很大的问题。实际上在大多数实际情况下它们已经存储在内存中。
为了生成笛卡尔积流,您需要不断 "rewind" 所有流(第一个流除外)。要倒回,流应该能够一次又一次地检索原始数据,或者以某种方式缓冲它们(你不喜欢)或者从源(集合、数组、文件、网络、随机数等)中再次抓取它们。 ) 并一次又一次地执行所有中间操作。如果您的源和中间操作很慢,那么惰性解决方案可能比缓冲解决方案慢得多。如果您的来源无法再次生成数据(例如,随机数生成器无法生成与之前生成的相同的数字),您的解决方案将是不正确的。
然而,完全懒惰的解决方案是可能的。不使用流,而是使用流供应商:
private static <T> Stream<T> cartesian(BinaryOperator<T> aggregator,
Supplier<Stream<T>>... streams) {
return Arrays.stream(streams)
.reduce((s1, s2) ->
() -> s1.get().flatMap(t1 -> s2.get().map(t2 -> aggregator.apply(t1, t2))))
.orElse(Stream::empty).get();
}
这个解决方案很有趣,因为我们创建并减少供应商流以获取最终供应商并最终调用它。用法:
Stream<String> result = cartesian(
(a, b) -> a + b,
() -> Stream.of("A", "B"),
() -> Stream.of("K", "L"),
() -> Stream.of("X", "Y")
);
result.forEach(System.out::println);
您可以创建一个 returns List<T>
对象流并且不聚合它们的方法。算法是相同的:在每一步中,将第二个流的元素收集到一个列表中,然后将它们附加到第一个流的元素中。
聚合器在方法之外。
@SuppressWarnings("unchecked")
public static <T> Stream<List<T>> cartesianProduct(Stream<T>... streams) {
// incorrect incoming data
if (streams == null) return Stream.empty();
return Arrays.stream(streams)
// non-null streams
.filter(Objects::nonNull)
// represent each list element as SingletonList<Object>
.map(stream -> stream.map(Collections::singletonList))
// summation of pairs of inner lists
.reduce((stream1, stream2) -> {
// list of lists from second stream
List<List<T>> list2 = stream2.collect(Collectors.toList());
// append to the first stream
return stream1.flatMap(inner1 -> list2.stream()
// combinations of inner lists
.map(inner2 -> {
List<T> list = new ArrayList<>();
list.addAll(inner1);
list.addAll(inner2);
return list;
}));
}).orElse(Stream.empty());
}
public static void main(String[] args) {
Stream<String> stream1 = Stream.of("A", "B");
Stream<String> stream2 = Stream.of("K", "L");
Stream<String> stream3 = Stream.of("X", "Y");
@SuppressWarnings("unchecked")
Stream<List<String>> stream4 = cartesianProduct(stream1, stream2, stream3);
// output
stream4.map(list -> String.join("", list)).forEach(System.out::println);
}
String.join
在这种情况下是一种聚合器。
输出:
AKX
AKY
ALX
ALY
BKX
BKY
BLX
BLY
另请参阅: