2024 Clojure状态调查中分享您的想法!

欢迎!请参阅关于页面了解更多关于如何使用本站的信息。

+1

我需要读取Microsoft Word docx文档。
文档可能有表格需要导入,我希望捕捉到文本中的颜色(突出显示)。

目前,我只找到了以下可能的方法
http://www.felix-johnson.com/docx4j.html

我希望从最先进的技术开始。

谢谢你的帮助!

2 答案

+1
不,docx-utils仅处理docx文档的生成。我需要读取docx文件。
+1

我通过Java互操作直接使用了Apache POI库,它适用于我需要的所有功能。 https://poi.apache.org/

我为使用的那部分库构建了一些包装,使其更适合我的需求。

谢谢!你介意分享你构建的包装代码吗?我需要从Java互操作示例中学习。
抱歉,我手头没有这些信息,这些只是很久以前剃掉了一些麻烦。
` `
不管怎样,通过互操作,POI(对于Excel电子表格来说)相当容易处理。

POI的表面区域非常大,包装可能不是很值得。

另一个选择是将文件以某些方式转换为RTF——我认为LibreOffice有命令行方式可以做到这一点——然后尝试读取RTF。

第三个选择是写一个Word宏来编写EDN文件 :-)
...