在 2024 年 Clojure 状态调查！中分享您的想法。

Question

clojure.java.io/copy 函数的奇怪行为

提问 Aug 25, 2019 在 IO 由 Juha Syrjälä

在 clojure.java.io/copy 函数的实现中，我发现了一个奇怪的行为

https://github.com/clojure/clojure/blob/ee1b606ad066ac8df2efd4a6b8d0d365c206f5bf/src/clj/clojure/java/io.clj#L391

(defn copy
  "Copies input to output.  Returns nil or throws IOException.
  Input may be an InputStream, Reader, File, byte[], char[], or String.
  Output may be an OutputStream, Writer, or File.
  Options are key/value pairs and may be one of
    :buffer-size  buffer size to use, default is 1024.
    :encoding     encoding to use if converting between
                  byte and char streams.   
  Does not close any streams except those it opens itself 
  (on a File)."
  {:added "1.2"}
  [input output & opts]
  (do-copy input output (when opts (apply hash-map opts))))

实际复制是从 InputStream 到 OutputStream 时实现的。

https://github.com/clojure/clojure/blob/ee1b606ad066ac8df2efd4a6b8d0d365c206f5bf/src/clj/clojure/java/io.clj#L306

(defmethod do-copy [InputStream OutputStream] [^InputStream input ^OutputStream output opts]
  (let [buffer (make-array Byte/TYPE (buffer-size opts))]
    (loop []
      (let [size (.read input buffer)]  ;;; XXX point 1
        (when (pos? size)               ;;; XXX point 2
          (do (.write output buffer 0 size)
              (recur)))))))

这里是第1处 .read 函数 https://docs.oracle.com/javase/7/docs/api/java/io/InputStream.html#read(byte[])

javadoc 声明如下

从输入流中读取一定数量的字节并将其存储到缓冲区数组 b 中。实际读取的字节数作为整数返回。此方法在输入数据可用、检测到文件末尾或抛出异常时停止阻塞。
如果 b 的长度为零，则不读取任何字节并返回 0；否则，尝试至少读取一个字节。如果没有可用的字节，因为流已到达文件末尾，则返回值 -1；否则，至少读取一个字节并将其存储到 b 中。

这意味着返回值 -1 表示流末尾，返回值 0 并不表示流末尾。然而，在上述代码中的第2处条件，在 .read 返回小于1的值时停止递归。

现在考虑一种情况，其中 .read 在连续调用中返回以下序列值

1024, 0, 1024, 201, -1

当整个流有2249字节时，clojure.java/io 只复制前1024字节。这是预期的行为吗？第1处的条件应该不是 (not (neg? size)) 吗？

我也在 google groups 上发布了这个问题：https://groups.google.com/forum/#!topic/clojure/XzpPPXXhgM4

2 条回答

alexmiller · Answer 1 · 2019-08-25T18:57:00+0000

评论了 Aug 25, 2019 by alexmiller

评论了 Aug 26, 2019 by NPException

评论了 Aug 26, 2019 by Juha Syrjälä

评论了 Aug 26, 2019 by Sean Corfield

Answer 2

我认为您误解了文档。这里的关键部分是

该方法阻塞直到有输入数据可用，...
至少读取一个字节并存储到b中。

因此，它永远不会读取零字节，除非缓冲区大小为零。

当前代码在零的情况下停止是正确的，这只会发生在传入的缓冲区大小为零的情况下。

在 2024 年 Clojure 状态调查！中分享您的想法。

clojure.java.io/copy 函数的奇怪行为

请登录或注册以添加评论。

请登录或注册以回答该问题。

2 条回答

请登录或注册以添加评论。

请登录或注册以添加评论。

分类

在 2024 年 Clojure 状态调查！中分享您的想法。

clojure.java.io/copy 函数的奇怪行为

请登录或注册以添加评论。

请登录或注册以回答该问题。

2 条回答

请登录或注册以添加评论。

请登录或注册以添加评论。

相关问题

分类