2024 Clojure 技术调查问卷 中分享您的看法!

欢迎!请查看 关于 页面了解更多有关此信息。

+1 投票

我需要读取 Microsoft Word docx 文档。
文档可能包含要导入的表格,并且我希望建档文本中的颜色(突出显示)。

到目前为止,我只找到了以下内容是合理的
http://www.felix-johnson.com/docx4j.html

我希望从最新技术开始。

谢谢您的帮助!

2 个答案

+1 投票
不,docx-utils 仅处理 docx 文档的创建。我需要读取 docx 文件。
+1 投票

我直接通过Java互操作使用了Apache POI库,这满足了我所有的需求。 https://poi.apache.org/

我为其中的小部分包装了一些代码,使其更适合我的需求。

by
谢谢!您介意分享您构建的这些包装代码吗?我需要从Java互操作的例子中学习。
by
抱歉,我手头没有这些信息,这只是一些很久以前的事情。
by
POI(至少对于Excel电子表格来说)通过互操作相当容易管理。

POI的表面区域太广,包装可能不会很有价值。

另一个选择是将格式转换成RTF,我认为LibreOffice有命令行方式可以实现这一点,然后您可以通过阅读RTF来「摸索’前进。

第三种选择是使用Word宏来编写EDN文件。
...