欢迎!请参阅关于页面以获取更多关于该页面如何工作的信息。
我需要读取Microsoft Word docx文档。文档可能包含需要采入的表格,我希望捕捉文本中的颜色(高亮)。
迄今为止,我只找到了以下可能的方法 http://www.felix-johnson.com/docx4j.html
我希望从最新技术开始。
谢谢您的帮助!
https://github.com/tokenmill/docx-utils看起来很相关。
我通过Java互操作直接使用了Apache POI库,这对我来说所有的需求都工作得很好。 https://poi.apache.org/
我在这部分库周围构建了一些封装器,以使其更符合我的需求。