在 2024 Clojure 状况调查中分享您的想法！

Question

限制使用 `clojure.string/split` 无法正确通过使用前瞻或后顾的正则表达式分割字符串

提问 Feb 16, 2018 在 ClojureScript 由 jira

{{clojure.string/split}} with a limit 无法正确按照以下方式分割字符串

(clojure.string/split "quaqb" #"q(?!u)"); <- 匹配后面不跟 'u' 的 'q'
;;=> ["qua" "b"]

(clojure.string/split "quaqb" #"q(?!u)" 2)
;;=> ["" "uaqb"]

第一个案例的结果是我们想要的，但第二个案例的结果是错误的。
因为，如果有限制，它会使用自己的算法来分割字符串，而不是使用 JavaScript 的 {{String.prototype.split}} 函数。
而当使用正则表达式中的 [前瞻或后顾|https://regexper.cn/lookaround.html] 时，该算法会有问题。

;; clojure.string/split
(let [re #"q(?!u)"]
  (loop [s "quaqb"
         limit 2
         parts []]
    (if (== 1 limit)
      (conj parts s)
      (let [m (re-find re s)] ; <- 1!
        (if-not (nil? m)
          (let [index (.indexOf s m)] ; <- 2!
            (recur (.substring s (+ index (count m)))
                   (dec limit)
                   (conj parts (.substring s 0 index))))
          (conj parts s))))))
;;=> ["" "uaqb"]

(re-find #"q(?!u)" "quaqb") ; <- 1!
;; => "q"

(.indexOf "quaqb" "q") ; <- 2!
;;=> 0

我们应该从 JavaScript 的 {{RegExp.prototype.exec}} 函数获取索引，而不是计算索引。

;; clojure.string/split
(let [re #"q(?!u)"]
  (loop [s "quaqb"
         limit 2
         parts []]
    (if (== 1 limit)
      (conj parts s)
      (let [m (.exec re s)]
        (if-not (nil? m)
          (let [index (.-index m)]
            (recur (.substring s (+ index (count (aget m 0))))
                   (dec limit)
                   (conj parts (.substring s 0 index))))
          (conj parts s))))))
;;=> ["qua" "b"]

=i测试了 V8, Spidermonkey, Nashorn。

6 答案

jira · Answer 1 · 2018-02-16T13:02:49+0000

评论者：vmfhrmfoaj

我更新了补丁以更改测试

jira · Answer 2 · 2018-02-16T14:30:34+0000

评论者：vmfhrmfoaj

我更新了补丁以修复边缘情况

jira · Answer 3 · 2018-02-16T18:36:25+0000

评论者：vmfhrmfoaj

我更新补丁以修复错误并添加测试
抱歉反复更新补丁，本以为很简单)

jira · Answer 4 · 2019-06-26T12:00:00+0000

参考：https://clojure.atlassian.net/browse/CLJS-2528（由 vmfhrmfoaj 提出）

在 2024 Clojure 状况调查中分享您的想法！

限制使用 `clojure.string/split` 无法正确通过使用前瞻或后顾的正则表达式分割字符串

请登录或注册以添加评论。

请登录或注册以回答此问题。

6 答案

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

分类

在 2024 Clojure 状况调查 中分享您的想法！

限制使用 `clojure.string/split` 无法正确通过使用前瞻或后顾的正则表达式分割字符串

请 登录 或 注册 以添加评论。

请 登录 或 注册 以回答此问题。

6 答案

请 登录 或 注册 以添加评论。

请 登录 或 注册 以添加评论。

请 登录 或 注册 以添加评论。

请 登录 或 注册 以添加评论。

请 登录 或 注册 以添加评论。

请 登录 或 注册 以添加评论。

相关问题

分类

在 2024 Clojure 状况调查中分享您的想法！

请登录或注册以添加评论。

请登录或注册以回答此问题。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。

请登录或注册以添加评论。