解析word文档除了用poi还可以用什么解析文档的内容

问题描述

解析word文档除了用poi还可以用什么解析文档的内容

我最近在研究word文档的解析,除了用poi的方式解析,还有什么方式可以解析word的文档的

解决方案

还可以用vba。java可以借助vbs js调用vba

http://ldbjakyo.iteye.com/blog/1698820

解决方案二:

java解析word文档

时间: 2024-12-21 15:54:50

解析word文档除了用poi还可以用什么解析文档的内容的相关文章

文档-POI解析Word , 目录这里有一串TOCo "1-3"hzu.....

问题描述 POI解析Word , 目录这里有一串TOCo "1-3"hzu..... 打算将word文档在自己的安卓应用中打开,网上找了代码,利用poi将文档转换成HTML 再用WebView打开,,,,,但是,我不知道为什么,解析完了之后,整体看起来没问题,目录栏那里出来一串如题的字符串.....TOCo "1-3"hzu..... 解决方案 toc = table of content(目录列表) 但是,怎么用poi自带的接口过滤掉,找了半天也没找... 你解决

用xml解析word文档,怎样解析,求思路,求代码,以及文档中图片和公式的解析

问题描述 用xml解析word文档,怎样解析,求思路,求代码,以及文档中图片和公式的解析 用xml解析word文档,怎样解析,求思路,求代码,以及文档中图片和公式的解析,请问哪位大神做过??? 解决方案 需求是什么呢?用什么语言,你说的xml解析word文档是什么意思呢? java里面对word文档的操作有POI工具包可以使用.

c++-Linux下C++实现解析word文档(.docx即可)

问题描述 Linux下C++实现解析word文档(.docx即可) Linux下C++实现解析word文档(.docx即可) 我的思路是先把docx解压缩,然后取得那个有内容的xml文件,对xml进行解析 但是输出的内容格式又很难控制与之前一样了,还有表格也完全没办法弄! 各位大神有什么好办法吗??或者推荐下直接解析docx的库 解决方案 楼上说的对 要做这个工作确实工作量是很大的,但是你如果只是简单操作的话倒也可以借助几个开源库尝试一下; docx格式的文件本质上是一个ZIP文件.将一个doc

java 解析 word-Java如何解析word文档到富文本编辑器中?

问题描述 Java如何解析word文档到富文本编辑器中? 现在有一个需求,使用Java将word解析到富文本编辑器内,要求内容和格式都不发生变化. 是不是先要将word文档转换为html文档再做处理?如果是的话,Java有什么好方法可以将word转换为html,服务器为Linux,所以Jacob不太好使.

java poi解析word问题,读取每段前自动生成的序号或目录结构

问题描述 java poi解析word问题,读取每段前自动生成的序号或目录结构 java中poi3.8 hwpfdocument 读取word 文档,没法独到word 文档每段开头的自动生成的序号 :如:一. (一). 解决方案 好像是没法自动生成序号的,你可以用vba函数编程来增加这些序号

c/s端,双击打开一个文档,ctrl+e还可以打开同一文档,如何屏蔽ctrl+e的打开功能

问题描述 c/s端,双击打开一个文档,ctrl+e还可以打开同一文档,如何屏蔽ctrl+e的打开功能当然了,ctrl+e可以重复N次打开同一文档,有什么办法可以屏蔽ctrl+e的打开功能比如是否可以获取已打开文档的unid....望高手解答! 解决方案 解决方案二:up我也不会,还没研究C/S那些牛X的功能解决方案三:呵呵,c/s我们只用来管理,不做实际应用.具体没用过,你试一下在"数据库资源"里的"数据库Script"里写点代码能不能解决问题.解决方案四:文档的U

当前不会命中断点,还没有加载该文档加载任何符号

断点调试是我编程时经常用到的,但有的程序并一定有Windows界面,而是附加到其他程序中的,如ArcGIS的Addin开发.当我在代码中插入断点调试无效(断点不起作用),并警告"当前不会命中断点,还没有加载该文档加载任何符号". 网上查了说可能是Framework版本的问题,我才恍然大悟:ArcGIS 10.1的Framework版本配置是3.5,而默认VS2010新建的程序Framework版本是4.0,原来如此.   修改目标框架后,要重新清理.重新生成一下. 虽然,调试时还是如此

将多个文档中的批注和修订合并至一个文档中

如果您发送一个文档以供多名审阅者审阅,并且每名审阅者都返回文档,则可以按照一次合并两个文档的方式组合这些文档,直到将所有审阅者修订都合并到单个文档中为止. 在"审阅"选项卡上的"比较"组中,单击"比较". 单击"将多位作者的修订组合到一个文档中". 在"原文档"下,单击要将来自多个来源的修订组合到其中的文档的名称. 如果没有在列表中看到该文档,请单击"浏览原始内容" . 在"修

.net-网页导出文档时COMException (0x800a13e9):内存不足请现在保存文档?

问题描述 网页导出文档时COMException (0x800a13e9):内存不足请现在保存文档? 解决方案 word挂了?是不是占有内存太多了.