过滤功能不偷懒
Filter Function Not Lazy
为了好玩,我正在制作我自己的 Java 流库版本。这是我的 class 签名:
class Stream<T> {
Supplier<T> head;
Supplier<Stream<T>> tail;
...
}
此外,我编写了一个基本的无限流迭代器,它会根据给定的函数生成一个无限列表:
public static <T> Stream<T> iterate(T first, Function<T, T> f) {
return new Stream<T>(
() -> first,
() -> {
T nextElem = f.apply(first);
if (nextElem == null) {
return generate(() -> null);
} else {
return iterate(nextElem, f);
}
}
);
}
函数generate
是迭代的一个特例,它永远重复一个给定的元素。在上面的函数中,我生成了一个 null
的无限序列来指示流的结尾(我不认为我会在流中存储空值)。
然后我写了一个reduce函数,其中reducing函数在第二个参数上是惰性的:
public <U> U reduce(U acc, Function<T, Function<Supplier<U>, U>> f) {
System.out.println("REDUCE CALL");
T elem = head.get();
if (elem != null) {
return f.apply(elem).apply(() -> this.tail.get().reduce(acc, f));
} else {
return acc;
}
}
在 reduce 函数的基础上,我编写了 filter 函数。
public Stream<T> filter(Predicate<T> p) {
System.out.println("FILTER");
return reduce(generate(() -> null), elem -> acc -> {
if (p.test(elem)) {
return new Stream<>(
() -> elem,
() -> acc.get()
);
} else {
return acc.get();
}
});
}
最后,我开始使用我自己的 Stream class:
public static void main(String[] args) {
Stream<Integer> ilist =
Stream
.iterate(1, x -> x + 1)
.filter(x -> x >= 5);
}
但过滤器并不懒惰!从下面给出的输出来看,我认为过滤器会评估元素,直到找到与给定谓词匹配的元素。
FILTER
REDUCE CALL
REDUCE CALL
REDUCE CALL
REDUCE CALL
REDUCE CALL
我的代码有什么问题,我怎样才能让我的过滤器函数再次惰性化?
更新: 根据 Sweeper 的评论,我在没有使用 reduce 的情况下再次尝试了过滤功能。
public Stream<T> filter2(Predicate<T> p) {
System.out.println("FILTER2");
T elem = head.get();
if (elem == null) {
return generate(() -> null);
} else {
if (p.test(elem)) {
return new Stream<>(
() -> elem,
() -> this.tail.get().filter2(p)
);
} else {
return this.tail.get().filter2(p);
}
}
}
但是,这个函数也不是懒惰的。我使用 filter2
的主要功能的输出如下:
FILTER2
FILTER2
FILTER2
FILTER2
FILTER2
我该如何解决这个问题,有没有办法通过惰性 reduce 实现惰性过滤器?
致谢:本练习和上述函数的实现受到 Chiusano 和 Bjarnason 合着的 Scala 函数式编程 一书的启发。
在你写的没有reduce
的版本中,元素存在但不满足谓词的情况不是惰性的。不像在其他情况下那样将递归调用包装在供应商 lambda 中,而是急切地获取尾巴并立即对其进行过滤。
public Stream<T> filter2(Predicate<T> p) {
System.out.println("FILTER2");
T elem = head.get();
if (elem == null) {
return generate(() -> null);
} else {
if (p.test(elem)) {
return new Stream<>(
() -> elem,
() -> this.tail.get().filter2(p)
);
} else {
return this.tail.get().filter2(p); // <- not lazy!
}
}
}
您需要一种创建流的方法,这样可以推迟到以后再决定它是否为空。
public class Stream<T> {
// private constructor(s)
public static <T> Stream<T> empty() { /* ... */ }
public static <T> Stream<T> cons(Supplier<T> head, Supplier<Stream<T> tail) { /* ... */ }
public static <T> Stream<T> lazy(Supplier<Stream<T>> stream) { /* ... */ }
public Stream<T> filter(Predicate<T> p) {
if ( /* this stream is empty */ ) {
return Stream.empty();
} else if ( /* head element satisfies predicate */ ) {
// lazily filter tail, cons head element
} else {
return Stream.lazy(() -> this.tail.get().filter(p));
}
}
}
类似的东西。
为了好玩,我正在制作我自己的 Java 流库版本。这是我的 class 签名:
class Stream<T> {
Supplier<T> head;
Supplier<Stream<T>> tail;
...
}
此外,我编写了一个基本的无限流迭代器,它会根据给定的函数生成一个无限列表:
public static <T> Stream<T> iterate(T first, Function<T, T> f) {
return new Stream<T>(
() -> first,
() -> {
T nextElem = f.apply(first);
if (nextElem == null) {
return generate(() -> null);
} else {
return iterate(nextElem, f);
}
}
);
}
函数generate
是迭代的一个特例,它永远重复一个给定的元素。在上面的函数中,我生成了一个 null
的无限序列来指示流的结尾(我不认为我会在流中存储空值)。
然后我写了一个reduce函数,其中reducing函数在第二个参数上是惰性的:
public <U> U reduce(U acc, Function<T, Function<Supplier<U>, U>> f) {
System.out.println("REDUCE CALL");
T elem = head.get();
if (elem != null) {
return f.apply(elem).apply(() -> this.tail.get().reduce(acc, f));
} else {
return acc;
}
}
在 reduce 函数的基础上,我编写了 filter 函数。
public Stream<T> filter(Predicate<T> p) {
System.out.println("FILTER");
return reduce(generate(() -> null), elem -> acc -> {
if (p.test(elem)) {
return new Stream<>(
() -> elem,
() -> acc.get()
);
} else {
return acc.get();
}
});
}
最后,我开始使用我自己的 Stream class:
public static void main(String[] args) {
Stream<Integer> ilist =
Stream
.iterate(1, x -> x + 1)
.filter(x -> x >= 5);
}
但过滤器并不懒惰!从下面给出的输出来看,我认为过滤器会评估元素,直到找到与给定谓词匹配的元素。
FILTER
REDUCE CALL
REDUCE CALL
REDUCE CALL
REDUCE CALL
REDUCE CALL
我的代码有什么问题,我怎样才能让我的过滤器函数再次惰性化?
更新: 根据 Sweeper 的评论,我在没有使用 reduce 的情况下再次尝试了过滤功能。
public Stream<T> filter2(Predicate<T> p) {
System.out.println("FILTER2");
T elem = head.get();
if (elem == null) {
return generate(() -> null);
} else {
if (p.test(elem)) {
return new Stream<>(
() -> elem,
() -> this.tail.get().filter2(p)
);
} else {
return this.tail.get().filter2(p);
}
}
}
但是,这个函数也不是懒惰的。我使用 filter2
的主要功能的输出如下:
FILTER2
FILTER2
FILTER2
FILTER2
FILTER2
我该如何解决这个问题,有没有办法通过惰性 reduce 实现惰性过滤器?
致谢:本练习和上述函数的实现受到 Chiusano 和 Bjarnason 合着的 Scala 函数式编程 一书的启发。
在你写的没有reduce
的版本中,元素存在但不满足谓词的情况不是惰性的。不像在其他情况下那样将递归调用包装在供应商 lambda 中,而是急切地获取尾巴并立即对其进行过滤。
public Stream<T> filter2(Predicate<T> p) {
System.out.println("FILTER2");
T elem = head.get();
if (elem == null) {
return generate(() -> null);
} else {
if (p.test(elem)) {
return new Stream<>(
() -> elem,
() -> this.tail.get().filter2(p)
);
} else {
return this.tail.get().filter2(p); // <- not lazy!
}
}
}
您需要一种创建流的方法,这样可以推迟到以后再决定它是否为空。
public class Stream<T> {
// private constructor(s)
public static <T> Stream<T> empty() { /* ... */ }
public static <T> Stream<T> cons(Supplier<T> head, Supplier<Stream<T> tail) { /* ... */ }
public static <T> Stream<T> lazy(Supplier<Stream<T>> stream) { /* ... */ }
public Stream<T> filter(Predicate<T> p) {
if ( /* this stream is empty */ ) {
return Stream.empty();
} else if ( /* head element satisfies predicate */ ) {
// lazily filter tail, cons head element
} else {
return Stream.lazy(() -> this.tail.get().filter(p));
}
}
}
类似的东西。