评论者:jdevuyst
嗯。我想懒序列确实导致了大量的分配。
好的,我重写了我的测试,并运行了几次。现在我也在向量和数组上进行测试。
补丁1需要些许调整。当调用coll-fold时,补丁1只为类型{{object}}指定了后备(即调用r/reduce)。我必须为类型{{array}}添加相同的后备。(这真奇怪!)
所以下面是结果。
对于向量
`
(let [coll (vec (repeat 100 (vec (range 100))))]
(time (dotimes [n 3000]
(->> coll
(r/mapcat identity)
(r/map inc)
(r/filter even?)
(r/fold +)))))
`
补丁1: 205872毫秒
补丁2: 210756毫秒
对于数组
`
(let [coll (into-array (repeat 100 (into-array (range 100))))]
(time (dotimes [n 3000]
(->> coll
(r/mapcat identity)
(r/map inc)
(r/filter even?)
(r/fold +)))))
`
补丁1: 123567毫秒
补丁2: 119704毫秒
我进行了多次测试,结果相当一致。补丁1适合向量,补丁2适合数组。
这很有道理。
在补丁1中,{{reducer}}将直接调用{{-reduce}}。在补丁2中,{{reducer}}首先调用{{r/reduce}},如果集合是向量,则调用{{-reduce}};如果是数组,则调用{{array-reduce}}。因此,在向量的情况下,补丁2包含一个额外的函数调用,但可以避免在数组上调用原语类型的协议方法。
使用宏(或复制粘贴)可以避免额外的函数调用。这值得尝试吗,或者保持代码清洁更重要?
--
我刚刚意识到,补丁2的语义与Clojure略有不同,尽管这可能是Clojure的bug:[链接](https://groups.google.com/forum/#!searchin/clojure-dev/kv-reduce/clojure-dev/bEqECvbExGo/iW4B2vEUh8sJ)。我对使用宏(或复制粘贴)的建议,也可以解决这个差异问题。