评论者:michalmarczyk
首先,为了完整性,这里提供了一个新的补丁(0001-CLJ-1372-consistent-hasheq-for-java.util.-List-Map-M-alternative.patch),它不会对未处理的类型进行额外嘈杂的处理。单独的PHM情况下会较慢;下面将详细介绍。另外,GitHub上的分支如下
https://github.com/michalmarczyk/clojure/tree/alien-hasheq-3
关于新的结果,性能下降相当大,我担心
`
;;; 使用补丁(平凡版本Murmur hash代码)
user=> (let [class-instance java.lang.String character-instance \a var-instance #'hash] (c/bench (clojure.lang.Util/hasheq class-instance)) (c/bench (clojure.lang.Util/hasheq character-instance)) (c/bench (clojure.lang.Util/hasheq var-instance)))
WARNING: 最终GC耗费1.409118084170768 %的运行时间
评估次数:655363680次,在60个样本中,每次调用10922728次。
Execution time mean : 96.459888 ns
Execution time std-deviation : 1.019817 ns
执行时间下四分位:95.079086纳秒(2.5%)
执行时间上四分位:98.684168纳秒(97.5%)
Overhead used : 1.708347 ns
评估次数:675919140次,在60个样本中,每次调用11265319次。
Execution time mean : 88.965959 ns
Execution time std-deviation : 0.825226 ns
执行时间下四分位:87.817159纳秒(2.5%)
执行时间上四分位:90.755688纳秒(97.5%)
Overhead used : 1.708347 ns
评估次数:574987680次,在60个样本中,每次调用9583128次。
Execution time mean : 103.881498 ns
Execution time std-deviation : 1.103615 ns
执行时间下四分位:102.257474纳秒(2.5%)
执行时间上四分位:106.071144纳秒(97.5%)
Overhead used : 1.708347 ns
在60个样本中找到1个异常值(1.6667%)
low-severe 1 (1.6667 %)
离群值方差:1.6389 % 离群值略微提高了方差
nil
;;; 1.6.0
user=> (let [class-instance java.lang.String character-instance \a var-instance #'hash] (c/bench (clojure.lang.Util/hasheq class-instance)) (c/bench (clojure.lang.Util/hasheq character-instance)) (c/bench (clojure.lang.Util/hasheq var-instance)))
WARNING: 最终GC耗费1.3353133083866688 %的运行时间
评估次数:1829305260次,在60个样本中,每次调用30488421次。
Execution time mean : 34.205701 ns
Execution time std-deviation : 0.379106 ns
执行时间下四分位:33.680636纳秒(2.5%)
执行时间上四分位:34.990138纳秒(97.5%)
Overhead used : 1.718257 ns
在60个样本中找到2个异常值(3.3333%)
low-severe 1 (1.6667 %)
low-mild 1 (1.6667 %)
离群值方差:1.6389 % 离群值略微提高了方差
评估次数:1858100340次,在60个样本中,每次调用30968339次。
Execution time mean : 30.401309 ns
Execution time std-deviation : 0.213878 ns
执行时间下四分位:30.095976纳秒(2.5%)
执行时间上四分位:30.871497纳秒(97.5%)
Overhead used : 1.718257 ns
评估次数:1592932200次,在60个样本中,每次调用26548870次。
Execution time mean : 36.292934 ns
Execution time std-deviation : 0.333512 ns
执行时间下四分位:35.795063纳秒(2.5%)
执行时间上四分位:36.918183纳秒(97.5%)
Overhead used : 1.718257 ns
在60个样本中找到1个异常值(1.6667%)
low-severe 1 (1.6667 %)
离群值方差:1.6389 % 离群值略微提高了方差
nil
`
新的补丁(默认情况无额外Murmur步骤)的PHM和Class/Character/Var结果
`
user=> (let [phm (apply hash-map (interleave (range 128) (range 128))) juhm (java.util.HashMap. phm)] #_(assert (= (hash phm) (hash juhm))) (c/bench (unchecked-add (clojure.lang.Util/hasheq phm) (unchecked-add (clojure.lang.Util/hasheq "foo") (clojure.lang.Util/hasheq 123)))))
WARNING: 最终GC耗费1.258952964663877 %的运行时间
评估次数:1007768460次,在60个样本中,每次调用16796141次。
Execution time mean : 58.195608 ns
Execution time std-deviation : 0.482804 ns
执行时间下四分位:57.655857纳秒(2.5%)
执行时间上四分位:59.154655纳秒(97.5%)
Overhead used : 1.567532 ns
在60个样本中找到1个异常值(1.6667%)
low-severe 1 (1.6667 %)
离群值方差:1.6389 % 离群值略微提高了方差
nil
user=> (let [class-instance java.lang.String character-instance \a var-instance #'hash] (c/bench (clojure.lang.Util/hasheq class-instance)) (c/bench (clojure.lang.Util/hasheq character-instance)) (c/bench (clojure.lang.Util/hasheq var-instance)))
评估次数:647944080次,在60个样本中,每次调用10799068次。
Execution time mean : 91.275863 ns
Execution time std-deviation : 0.659943 ns
执行时间下四分位:90.330980纳秒(2.5%)
执行时间上四分位:92.711120纳秒(97.5%)
Overhead used : 1.567532 ns
评估次数:699506160次,在60个样本中,每次调用11658436次。
Execution time mean : 84.564131 ns
Execution time std-deviation : 0.517071 ns
执行时间下四分位:83.765607纳秒(2.5%)
执行时间上四分位:85.569206纳秒(97.5%)
Overhead used : 1.567532 ns
在60个样本中找到1个异常值(1.6667%)
low-severe 1 (1.6667 %)
离群值方差:1.6389 % 离群值略微提高了方差
评估次数:594919980次,在60个样本中,每次调用9915333次。
Execution time mean : 100.336792 ns
Execution time std-deviation : 0.811312 ns
执行时间下四分位:99.313490纳秒(2.5%)
执行时间上四分位:102.167675纳秒(97.5%)
Overhead used : 1.567532 ns
在60个样本中发现3个离群值(5.0000%)
low-severe 3 (5.0000 %)
离群值方差:1.6389 % 离群值略微提高了方差
nil
`