欢迎!有关此网站的工作方式,请参阅关于页面了解更多信息。
我需要读取Microsoft Word docx文档。这些文档可能包含要提取的表格,并且我希望捕获文本中的颜色(突出显示)。
到目前为止,我只找到了以下可能的信息 http://www.felix-johnson.com/docx4j.html
我希望从当前的技术状态开始。
谢谢您的帮助!
https://github.com/tokenmill/docx-utils看起来相关。
我直接通过Java互操作使用了Apache POI库,这对于我需要的所有事情都工作得很好。 https://poi.apache.org/
我为使用的那一小部分代码构建了一些包装,让它更适合我的需求。