无限序列的惰性序列和堆栈溢出

lazy-seq and stack overflow for infinite sequences

我试图向非 FP 程序员展示惰性序列或惰性求值的重要性。我写了这个素数生成的实现来展示这个概念:

(defn primes-gen [sieve]
  (if-not (empty? sieve)
    (let [prime (first sieve)]
      (cons prime
            (lazy-seq (primes-gen
                       (filter (fn [x]
                                 (not= 0 (mod x prime)))
                               (rest sieve))))))))

;;;;; --------- TO SHOW ABOUT THE LAZY-THINGS 
;; (take 400 (primes-gen (iterate inc 2)))
;; (take 400 (primes-gen (range 2 1000000000000N)))

但是,如果我给 take 任何更大的值,我会得到堆栈溢出异常。

堆栈是:

user> (pst)
WhosebugError 

    clojure.core/range/fn--4269 (core.clj:2664)
    clojure.lang.LazySeq.sval (LazySeq.java:42)
    clojure.lang.LazySeq.seq (LazySeq.java:60)
    clojure.lang.RT.seq (RT.java:484)
    clojure.core/seq (core.clj:133)
    clojure.core/filter/fn--4226 (core.clj:2523)
    clojure.lang.LazySeq.sval (LazySeq.java:42)
    clojure.lang.LazySeq.seq (LazySeq.java:60)
    clojure.lang.RT.seq (RT.java:484)
    clojure.core/seq (core.clj:133)

看来 filter thunks 越来越多了。 但是如果 (doall (filter ... 那么我将无法处理无限序列,即 (take 1000 (primes-gen (iterate inc 2))) 将不再工作。

正确的做法是什么?

您的分析很到位:您嵌套的过滤器太多了。 您应该修改 prime-gen 以采用两个参数:一组已知素数和候选素数。 有关 implementing the Erathostenes' sieve.

的一些其他想法,请参阅我的博客

更新: 因此,您将过滤器堆叠在过滤器上,并且在某些时候,当您想要获取新的候选人时,堆栈太大了。

您必须将所有过滤器合并为一个(或合理数量的)通道。这很容易,因为过滤器非常均匀。所以我用一个包含已知素数的集合替换过滤器堆栈。

(defn primes-gen
 ([candidates] (primes-gen candidates []))
 ([candidates known-primes]
  (lazy-seq ; I prefer having the lazy-seq up here
    (when-first [prime candidates] ; little known macro
      (let [known-primes (conj known-primes prime)]
        (cons prime
          (primes-gen
            (drop-while (fn [n] (some #(zero? (mod n %)) known-primes)) candidates)
             known-primes)))))))

可能的解决方案之一是将生成器函数移到惰性序列中。例如(取自here):

(def primes
  (concat
   [2 3 5 7]
   (lazy-seq
    (let [primes-from
          (fn primes-from [n [f & r]]
            (if (some #(zero? (rem n %))
                      (take-while #(<= (* % %) n) primes))
              (recur (+ n f) r)
              (lazy-seq (cons n (primes-from (+ n f) r)))))
          wheel (cycle [2 4 2 4 6 2 6 4 2 4 6 6 2 6  4  2
                        6 4 6 8 4 2 4 2 4 8 6 4 6 2  4  6
                        2 6 6 4 2 4 6 2 6 4 2 4 2 10 2 10])]
      (primes-from 11 wheel)))))