由jdevuyst发表的评论:
嗯。我想惰性序列确实会导致许多分配。
好吧,我重写了测试并再次运行了几次。现在我也在向量和数组上进行了测试。
补丁1需要稍作调整。当coll-fold被调用时,补丁1只为{{object}}类型指定了回退(即调用{{r/reduce}})。我必须为{{array}}类型添加相同的回退。(好奇怪!)
所以这里是结果。
对于向量
`
(let [coll (vec (repeat 100 (vec (range 100))))]
(time (dotimes [n 3000]
(->> coll
(r/mapcat identity)
(r/map inc)
(r/filter even?)
(r/fold +)))))
`
补丁1: 205872 毫秒
补丁2: 210756 毫秒
对于数组
`
(let [coll (into-array (repeat 100 (into-array (range 100))))]
(time (dotimes [n 3000]
(->> coll
(r/mapcat identity)
(r/map inc)
(r/filter even?)
(r/fold +)))))
`
补丁1: 123567 毫秒
补丁2: 119704 毫秒
我跑了几次测试,结果相当一致。对于向量,补丁1更快,对于数组,补丁2更快。
这是有道理的。
在补丁1中,{{reducer}}将直接调用{{-reduce}}。在补丁2中,{{reducer}}首先调用{{r/reduce}}, 如果集合是向量则调用{{-reduce}},如果数组则调用{{array-reduce}}。因此,在向量的情况下,补丁2包含一个额外的函数调用,但在数组的情况下避免了在原生类型上调用协议方法。
使用宏(或复制粘贴)可以避免额外的函数调用。这是否值得一试,或者保持代码清洁更重要?
--
我刚刚意识到补丁2在语义上略不同于Clojure处理的方式,尽管也许这是Clojure的一个错误:https://groups.google.com/forum/#!searchin/clojure-dev/kv-reduce/clojure-dev/bEqECvbExGo/iW4B2vEUh8sJ。我对使用宏(或复制粘贴)以避免补丁2中额外函数调用的建议,也可能修复这一差异。