评论由:jdevuyst
嗯,我想这个懒惰的序列导致了大量的分配。
好的,我重写了我的测试,并再次运行了几次。我还在矢量和数组上进行了测试。
第1个补丁需要一点点调整。当 coll-fold 调用时,第1个补丁只为类型 {{object}} 指定了一个后备(即,调用 {{r/reduce}})。我不得不为类型 {{array}} 添加相同的后备。(这很奇怪!)
因此,以下是结果。
对于向量
`
(let [coll (vec (repeat 100 (vec (range 100))))]
(time (dotimes [n 3000]
(->> coll
(r/mapcat identity)
(r/map inc)
(r/filter even?)
(r/fold +)))))
`
补丁1:205872毫秒
补丁2:210756毫秒
对于数组
`
(let [coll (into-array (repeat 100 (into-array (range 100))))]
(time (dotimes [n 3000]
(->> coll
(r/mapcat identity)
(r/map inc)
(r/filter even?)
(r/fold +)))))
`
补丁1:123567毫秒
补丁2:119704毫秒
我运行了几次测试,结果相当一致。对于向量,补丁1更快,对于数组,补丁2更快。
这很合理。
在补丁1中,{{reducer}} 将直接调用 {{-reduce}}。在补丁2中,{{reducer}} 首先调用 {{r/reduce}},后者在集合是向量时调用 {{-reduce}},如果是数组则调用 {{array-reduce}}。因此,在向量的情况下,补丁2包含一个额外的函数调用,但在数组的情况下避免了在原生类型上调用协议方法。
使用宏(或复制粘贴)可以避免额外的函数调用。这值得尝试吗?或者,保持代码整洁是否更重要?
--
我刚刚意识到,补丁2在语义上略与 Clojure 不同,尽管这可能是在 Clojure 里的一个bug:[链接](https://groups.google.com/forum/#!searchin/clojure-dev/kv-reduce/clojure-dev/bEqECvbExGo/iW4B2vEUh8sJ)。我提出使用宏(或复制粘贴)以避免补丁2中的额外函数调用,这也可能修复这个不一致性。