2024Clojure现状调查中分享你的想法!

欢迎!有关如何使用本页面的更多信息,请参阅关于页面。

0
Clojure
*描述*
有时需要对一组值与单个值进行比较,clojure内部定义了一个专为这个目的而设的谓词,它的性能比简单的部分应用的 = 有所改进。

与 Rich 的先前讨论: https://groups.google.com/forum/#!topic/clojure-dev/0c-VNhEKVkI

*示例用法*

;;之前
(map (partial = 3) coll)
;;之后
(map (=to 3) coll)


*基准测试*

||测试||(partial = 'foo)||#(= 'foo %)||(=to 'foo)||
|小型同构集合|217ns|165ns|39ns|
|小型异构集合,|192ns|167ns|41ns|
|大型同构集合|66us|52us|8us|
|大型异构集合|82us|66us|27us|

*完整基准测试结果*

(use 'criterium.core)

(defn benchmark-f [f]
  (let [colls [['foo 'foo 'foo]
               [1 :foo 'foo]
               (doall (repeat 1e3 'foo))
               (doall (take 1e3 (cycle [1 :foo 'foo])))]]
    (doseq [c colls]
      (quick-bench (run! f c)))))

(benchmark-f (partial = 'foo))
WARNING: Final GC required 1.405293826432628 % of runtime
WARNING: Final GC required 10.202923149112559 % of runtime
Evaluation count : 3116130 in 6 samples of 519355 calls.
Execution time mean : 217.723199 ns
Execution time std-deviation : 29.425291 ns
Execution time lower quantile : 189.944710 ns ( 2.5%)
Execution time upper quantile : 261.717351 ns (97.5%)
Overhead used : 1.863362 ns
WARNING: Final GC required 4.2579397621583315 % of runtime
Evaluation count : 3138636 in 6 samples of 523106 calls.
Execution time mean : 198.985418 ns
Execution time std-deviation : 12.691848 ns
Execution time lower quantile : 182.441245 ns ( 2.5%)
Execution time upper quantile : 207.839280 ns (97.5%)
Overhead used : 1.863362 ns
WARNING: Final GC required 6.631646134523004 % of runtime
Evaluation count : 10038 in 6 samples of 1673 calls.
Execution time mean : 66.977712 µs
Execution time std-deviation : 10.411821 µs
Execution time lower quantile : 59.620690 µs ( 2.5%)
Execution time upper quantile : 84.483254 µs (97.5%)
Overhead used : 1.863362 ns

Found 1 outliers in 6 samples (16.6667 %)
low-severe  1 (16.6667 %)
Variance from outliers : 47.3059 % Variance is moderately inflated by outliers
WARNING: Final GC required 5.272721959665122 % of runtime
Evaluation count : 7908 in 6 samples of 1318 calls.
Execution time mean : 82.588512 µs
Execution time std-deviation : 5.215537 µs
Execution time lower quantile : 75.977936 µs ( 2.5%)
Execution time upper quantile : 86.849982 µs (97.5%)
Overhead used : 1.863362 ns


(benchmark-f #(= 'foo %))
警告:最终的GC占用了运行时1.284421364203217%。
警告:最终的GC占用了运行时10.04376144830405%。
评估次数:在607172次调用中的6个样本中为3643032次。
              执行时间平均值:165.393131纳秒
    执行时间标准偏差:1.041355纳秒
   执行时间下四分位数:164.277060纳秒(2.5%)
   执行时间上四分位数:166.849951纳秒(97.5%)
                   额外开销:1.605524纳秒
警告:最终的GC占用了运行时6.258680973295933%。
评估次数:在597429次调用中的6个样本中为3584574次。
             执行时间平均值:167.659014纳秒
    执行时间标准偏差:3.821817纳秒
   执行时间下四分位数:164.175156纳秒(2.5%)
   执行时间上四分位数:173.210781纳秒(97.5%)
                   额外开销:1.605524纳秒

Found 1 outliers in 6 samples (16.6667 %)
   低严重程度     1(16.6667%)
异常值的方差:13.8889% 异常值导致方差中度膨胀
警告:最终的GC占用了运行时6.914389197005716%。
评估次数:在1866次调用中的6个样本中共计11196次。
             执行时间平均值:52.593759微秒
    执行时间标准偏差:834.220092纳秒



(benchmark-f (=to 'foo))
警告:最终的GC占用了运行时7.40391654943877%。
评估次数:在2528178次调用中的6个样本中共计15169068次。
执行时间平均值:39.937424纳秒
执行时间标准偏差:2.782661纳秒
执行时间下四分位数:37.393937纳秒(2.5%)
执行时间上四分位数:42.780432纳秒(97.5%)
Overhead used : 1.863362 ns
警告:最终的GC占用了运行时5.986859953402835%。
评估次数:在2533332次调用中的6个样本中共计15199992次。
执行时间平均值:41.229082纳秒
执行时间标准偏差:2.815533纳秒
执行时间下四分位数:37.371527纳秒(2.5%)
执行时间上四分位数:43.208673纳秒(97.5%)
Overhead used : 1.863362 ns
警告:最终的GC占用了运行时5.039484046472016%。
评估次数:在11577次调用中的6个样本中共计69462次。
执行时间平均值:8.976972微秒
执行时间标准偏差:587.089991纳秒
执行时间下四分位数:8.505317微秒(2.5%)
执行时间上四分位数:9.744296微秒(97.5%)
Overhead used : 1.863362 ns
警告:最终的GC占用了运行时5.773010947849351%。
评估次数:在3892次调用中的6个样本中共计23352次。
执行时间平均值:27.277376微秒
执行时间标准偏差:2.115666微秒
执行时间下四分位数:25.719322微秒(2.5%)
执行时间上四分位数:30.123547微秒(97.5%)
Overhead used : 1.863362 ns


*补丁*:0001-CLJ-1843-为加快对-kn的等价性检查而添加到-for的功能。

7 个答案

0
by

评论由:alexmiller发表

你看了(应用=3 coll)吗?只是好奇。

0

评论人:bronsa

与Util/equiv相比,Util/equivPred的优势在于它可以推断提供的参数类型,避免了Util/equiv内部进行多次实例检查所花费的运行时成本,以确定要使用的比较器

0

评论由:alexmiller发表

你能量化这些方法在2-3个集合大小之间的差异吗?

0
_评论人:bronsa_

以下设置


(use 'criterium.core)

(defn =to [x]
  (let [pred (clojure.lang.Util/equivPred x)]
    (fn [y]
      (.equiv pred x y))))

(defn benchmark-f [f]
  (let [colls [['foo 'foo 'foo]
               [1 :foo 'foo]
               (doall (repeat 1e3 'foo))
               (doall (take 1e3 (cycle [1 :foo 'foo])))]]
    (doseq [c colls]
      (quick-bench (run! f c)))))

(benchmark-f (partial = 'foo))的结果是



警告:最终GC耗用了运行时的1.405293826432628 %
WARNING: Final GC required 10.202923149112559 % of runtime
Evaluation count : 3116130 in 6 samples of 519355 calls.
Execution time mean : 217.723199 ns
Execution time std-deviation : 29.425291 ns
Execution time lower quantile : 189.944710 ns ( 2.5%)
Execution time upper quantile : 261.717351 ns (97.5%)
Overhead used : 1.863362 ns
WARNING: Final GC required 4.2579397621583315 % of runtime
Evaluation count : 3138636 in 6 samples of 523106 calls.
Execution time mean : 198.985418 ns
Execution time std-deviation : 12.691848 ns
Execution time lower quantile : 182.441245 ns ( 2.5%)
Execution time upper quantile : 207.839280 ns (97.5%)
Overhead used : 1.863362 ns
WARNING: Final GC required 6.631646134523004 % of runtime
Evaluation count : 10038 in 6 samples of 1673 calls.
Execution time mean : 66.977712 µs
Execution time std-deviation : 10.411821 µs
Execution time lower quantile : 59.620690 µs ( 2.5%)
Execution time upper quantile : 84.483254 µs (97.5%)
Overhead used : 1.863362 ns

Found 1 outliers in 6 samples (16.6667 %)
low-severe  1 (16.6667 %)
Variance from outliers : 47.3059 % Variance is moderately inflated by outliers
WARNING: Final GC required 5.272721959665122 % of runtime
Evaluation count : 7908 in 6 samples of 1318 calls.
Execution time mean : 82.588512 µs
Execution time std-deviation : 5.215537 µs
Execution time lower quantile : 75.977936 µs ( 2.5%)
Execution time upper quantile : 86.849982 µs (97.5%)
Overhead used : 1.863362 ns


(benchmark-f (=to 'foo))的结果是


警告:最终的GC占用了运行时7.40391654943877%。
评估次数:在2528178次调用中的6个样本中共计15169068次。
执行时间平均值:39.937424纳秒
执行时间标准偏差:2.782661纳秒
执行时间下四分位数:37.393937纳秒(2.5%)
执行时间上四分位数:42.780432纳秒(97.5%)
Overhead used : 1.863362 ns
警告:最终的GC占用了运行时5.986859953402835%。
评估次数:在2533332次调用中的6个样本中共计15199992次。
执行时间平均值:41.229082纳秒
执行时间标准偏差:2.815533纳秒
执行时间下四分位数:37.371527纳秒(2.5%)
执行时间上四分位数:43.208673纳秒(97.5%)
Overhead used : 1.863362 ns
警告:最终的GC占用了运行时5.039484046472016%。
评估次数:在11577次调用中的6个样本中共计69462次。
执行时间平均值:8.976972微秒
执行时间标准偏差:587.089991纳秒
执行时间下四分位数:8.505317微秒(2.5%)
执行时间上四分位数:9.744296微秒(97.5%)
Overhead used : 1.863362 ns
警告:最终的GC占用了运行时5.773010947849351%。
评估次数:在3892次调用中的6个样本中共计23352次。
执行时间平均值:27.277376微秒
执行时间标准偏差:2.115666微秒
执行时间下四分位数:25.719322微秒(2.5%)
执行时间上四分位数:30.123547微秒(97.5%)
Overhead used : 1.863362 ns
0
_评论人:bronsa_

使用#(= 'foo %)而不是(partial = 'foo)可以让=内联,从而使性能略微提高,但=to仍然明显占优

警告:最终的GC占用了运行时1.284421364203217%。
警告:最终的GC占用了运行时10.04376144830405%。
评估次数:在607172次调用中的6个样本中为3643032次。
              执行时间平均值:165.393131纳秒
    执行时间标准偏差:1.041355纳秒
   执行时间下四分位数:164.277060纳秒(2.5%)
   执行时间上四分位数:166.849951纳秒(97.5%)
                   额外开销:1.605524纳秒
警告:最终的GC占用了运行时6.258680973295933%。
评估次数:在597429次调用中的6个样本中为3584574次。
             执行时间平均值:167.659014纳秒
    执行时间标准偏差:3.821817纳秒
   执行时间下四分位数:164.175156纳秒(2.5%)
   执行时间上四分位数:173.210781纳秒(97.5%)
                   额外开销:1.605524纳秒

Found 1 outliers in 6 samples (16.6667 %)
   低严重程度     1(16.6667%)
异常值的方差:13.8889% 异常值导致方差中度膨胀
警告:最终的GC占用了运行时6.914389197005716%。
评估次数:在1866次调用中的6个样本中共计11196次。
             执行时间平均值:52.593759微秒
    执行时间标准偏差:834.220092纳秒
   执行时间低四分位数:51.510161 µs ( 2.5%)
   执行时间高四分位数:53.367649 µs (97.5%)
                   额外开销:1.605524纳秒
警告:最终GC耗用了运行时的6.179040224498723 %
评估次数:9162次,在6个样本中进行了1527次调用。
             执行时间平均值:66.527357 µs
   执行时间标准差:2.119652 µs
   执行时间低四分位数:65.308835 µs ( 2.5%)
   执行时间高四分位数:70.201570 µs (97.5%)
                   额外开销:1.605524纳秒


小型同质集合,*(partial = 'foo)*: 217ns,*#(= 'foo %)*: 165ns,*(=to 'foo)*: 39ns
小型异质集合,*(partial = 'foo)*: 192ns,*#(= 'foo %)*: 167ns,*(=to 'foo)*: 41ns
大型同质集合,*(partial = 'foo)*: 66us,*#(= 'foo %)*: 52us,*(=to 'foo)*: 8us
大型异质集合,*(partial = 'foo)*: 82us,*#(= 'foo %)*: 66us,*(=to 'foo)*: 27us
0

评论人:bronsa

显然,几年前的讨论中就已经讨论过这个问题,Rich似乎对这个做法没有异议。https://groups.google.com/forum/#!topic/clojure-dev/0c-VNhEKVkI

0
参考: https://clojure.atlassian.net/browse/CLJ-1843(报告者:bronsa)
...