在 2024 状态 clojure 问卷调查中分享您的想法！

Question

将三arity添加到 < <= > >= = == not=

提问 Dec 3, 2016 在 Clojure 由 jira

在我的实践中，使用小于/大于操作符的三arity非常常见，例如检查数字是否在范围内

(< 0 temp 100)

问题是，它比 {{(and (< 0 temp) (< temp 100))}} 快了近三倍。

这是因为三arity由通用的可变参数 arity 分支处理

(defn <
  "如果数字按单调递增顺序排列，则非nil，否则 false。"
  {:inline (fn [x y] `(. clojure.lang.Numbers (lt ~x ~y)))
   :inline-arities #{2}
   :added "1.0"}
  ([x] true)
  ([x y] (. clojure.lang.Numbers (lt x y)))
  ([x y & more]
    (if (< x y)
       (if (next more)
         (recur y (first more) (next more))
       (< y (first more)))
     false)


此补丁为这些函数添加了特殊的三个参数处理：{{< <= > >= = == not=}}

(defn <
  "如果数字按单调递增顺序排列，则非nil，否则 false。"
  {:inline (fn [x y] `(. clojure.lang.Numbers (lt ~x ~y)))
   :inline-arities #{2}
   :added "1.0"}
  ([x] true)
  ([x y] (. clojure.lang.Numbers (lt x y)))
  ([x y & more]
  ([x y z] (and (. clojure.lang.Numbers (lt x y))
                (. clojure.lang.Numbers (lt y z))))
  ([x y z & more]
   (if (< x y)
     (let [nmore (next more)]
       (if nmore
         (recur y z (first more) nmore)
         (< y z (first more))))
     false)))

性能提升非常显著

(= 5 5 5) 24.508635 ns => 4.802783 ns (-80%)
(not= 1 2 3) 122.085793 ns => 21.828776 ns (-82%)
(< 1 2 3) 30.842993 ns => 6.714757 ns (-78%)
(<= 1 2 2) 30.712399 ns => 6.011326 ns (-80%)
(> 3 2 1) 22.577751 ns => 6.893885 ns (-69%)
(>= 3 2 2) 21.593219 ns => 6.233540 ns (-71%)
(== 5 5 5) 19.700540 ns => 6.066265 ns (-69%)

更高arity的速度也变得更快，主要是因为现在迭代次数更少

(= 5 5 5 5) 50.264580 ns => 31.361655 ns (-37%)
(< 1 2 3 4) 68.059758 ns => 43.684409 ns (-35%)
(<= 1 2 2 4) 65.653826 ns => 45.194730 ns (-31%)
(> 3 2 1 0) 119.239733 ns => 44.305519 ns (-62%)
(>= 3 2 2 0) 65.738453 ns => 44.037442 ns (-33%)
(== 5 5 5 5) 50.773521 ns => 33.725097 ns (-33%)

此外，此补丁还将 {{not=}} 的可变参数 arity 改为使用 next/recur 而不是 {{apply}}

(defn not=
  "与 (not (= obj1 obj2)) 相同。"
  {:tag Boolean
   :added "1.0"
   :static true}
  ([x] false)
  ([x y] (not (= x y)))
  ([x y z] (not (= x y z)))
  ([x y z & more]
   (if (= x y)
     (let [nmore (next more)]
       (if nmore
         (recur y z (first more) nmore)
         (not= y z (first more))))
     true)))

结果良好

(not= 1 2 3 4) 130.517439 ns => 29.675640 ns (-77%)

我还在做[~wagjo]在CLJ-1912中做过的事情（只计算一次{{(next more)}}），尽管这样做带来的性能提升并不大。

我的观点是，优化三个参数是有意义的，因为这些参数在实际代码中出现的频率很高。更高阶数（4个及以上）的使用则要少得多。

9 个答案

jira · Answer 1 · 2016-12-03T08:32:09+0000

由tonsky发表评论

基准代码在此 https://gist.github.com/tonsky/442eda3ba6aa4a71fd67883bb3f61d99

jira · Answer 2 · 2016-12-03T14:24:48+0000

由alexmiller发表评论

将此与CLJ-1912合并可能更有意义，否则这些补丁将产生冲突。

jira · Answer 3 · 2016-12-03T19:02:05+0000

由tonsky发表评论

如果首先应用CLJ-1912，请使用此补丁

jira · Answer 4 · 2016-12-23T13:50:03+0000

由tonsky发表评论

我在之前的补丁中找到了一个问题，在定义{{=}}（等于）时，{{and}}（与）尚未定义。已替换为{{if}}

jira · Answer 5 · 2017-05-15T21:43:13+0000

评论者：tonsky

[~alexmiller] 这是一个重复的问题，但我的补丁要快得多。只要看看这些数字（相对于5-10%的增加，有70-80%的性能提升）。这是因为我引入了一个真正的arity，所以中间集合不会创建和反序列化，在有三个参数的情况下。

jira · Answer 6 · 2017-05-16T05:55:11+0000

评论者：wagjo

提供的补丁中有一个非常严重的错误，会导致例如{{(= 3 3 2)}}返回true。由于这个原因，我认为基准测试也有误。

jira · Answer 7 · 2017-05-16T21:13:02+0000

评论者：tonsky

[~wagjo] 感谢你指出这一点！附上一个更新的 pathological paths。基准测试也不是有很大错误，因为性能提升并非来自于减少或增加一次比较，而是因为不需要为未知arity调用函数带来的开销。

jira · Answer 8 · 2019-06-26T12:00:00+0000

参考：[https://clojure.atlassian.net/browse/CLJ-2075](https://clojure.atlassian.net/browse/CLJ-2075)（由 tonsky 报告）

在 2024 状态 clojure 问卷调查中分享您的想法！

将三arity添加到 < <= > >= = == not=

请登录或注册以添加评论。

请登录或注册以回答这个问题。

9 个答案

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

分类

在 2024 状态 clojure 问卷调查中分享您的想法！

将三arity添加到 < <= > >= = == not=

请登录或注册以添加评论。

请登录或注册以回答这个问题。

9 个答案

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

相关问题

分类