使用Java将Word转为Html或txt!

word

  使用Java将Word转为Html或txt。前一段时间为这个问题头疼的不得了,后来查阅了资料终于解决了;现将程序放出,以便以后参考。

  //-------------------------------------------------------
  //版权所有 (C) 浪潮集团商用系统有限公司  保留所有权利
  //文件名称: wordtohtml           文件版本: 1.00.00
  //作    者: 郭铸     作者邮箱: guozhu@langchao.com  完成日期: 2004-10-20
  //文件描述:
  //其它描述:
  //类 列 表:
  //  wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //修改历史:
  //  #   版本     修改日期    作者                 修改内容
  //  -------------------------------------------
  //  1   1.00.01  2004-10-14  作者姓名             修改内容描述
  //  ----------------------------------------------------------
  //-------------------------------------------------------
  import com.jacob.com.*;
  import com.jacob.activeX.*;
  import java.io.*;
  //取得指定目录下面所有的doc文件名称
  public class wordtohtml
  {
  //-------------------------------------------------
  //方法原型: change(String paths)
  //功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //输入参数: String
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 递归
  //--------------------------------------------
  public static void change(String paths, String savepaths)
  {
  
  File d = new File(paths);
  //取得当前文件夹下所有文件和目录的列表
  File lists[] = d.listFiles();
  String pathss = new String("");

  //对当前目录下面所有文件进行检索
  for(int i = 0; i < lists.length; i ++)
  {
  if(lists[i].isFile())
  {
  String filename = lists[i].getName();
  String filetype = new String("");
  //取得文件类型
  filetype = filename.substring((filename.length() - 3), filename.length());
  
  //判断是否为doc文件
  if(filetype.equals("doc"))
  {
  System.out.println("当前正在转换......");
  //打印当前目录路径
  System.out.println(paths);
  //打印doc文件名
  System.out.println(filename.substring(0, (filename.length() - 4)));
  
  ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word
  
  String docpath = paths + filename;
  String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));
  
  String inFile = docpath;
  //要转换的word文件
  String tpFile = htmlpath;
  //HTML文件

  boolean flag = false;
  
  try
  {
  app.setProperty("Visible", new Variant(false));
  //设置word不可见

  Object docs = app.getProperty("Documents").toDispatch();
  Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
  //打开word文件
  Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
  //作为html格式保存到临时文件
  Variant f = new Variant(false);
  Dispatch.call(doc, "Close", f);
  flag = true;
  }
  catch (Exception e)
  {
  e.printStackTrace();
  }
  finally
  {
  app.invoke("Quit", new Variant[] {});
  }
  System.out.println("转化完毕!");
  }
  }
  else
  {
  pathss = paths;
  //进入下一级目录
  pathss = pathss + lists[i].getName() + "\\";   
  //递归遍历所有目录
  change(pathss, savepaths);
  }
  }
  
  }
  //---------------------------------------------------------
  //方法原型: main(String[] args)
  //功能描述: main文件
  //输入参数: 无
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 无
  //---------------------------------------------------------- 
  public static void main(String[] args)
  {
  
  String paths = new String("D:\\Work\\2004.10.8\\test system\\test01\\word\\");
  String savepaths = new String ("D:\\Work\\2004.10.8\\test system\\test01\\html\\");
  change(paths, savepaths);

  }
  }

  其中import的jar包是一个开源的东东,网上搜索即得。
  Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{ tpFile,new Variant(8)}, new int[1]);
  修改Variant(8)},里面得参数即可将Word转化为各种类型。

时间: 2024-08-04 01:40:15

使用Java将Word转为Html或txt!的相关文章

希望用java操作word,有表格,数据较多,还有一个嵌入的txt

问题描述 希望用java操作word,有表格,数据较多,还有一个嵌入的txt 希望用java操作word,有表格,数据较多,还有一个嵌入的txt,freemarker好像不可以..... 解决方案 用Apache POI ,可以直接通过java程序操作word文档 解决方案二: 用POI的网上可以搜到也能下载到.

java-怎么使用Java将word文档转化为xml文档?

问题描述 怎么使用Java将word文档转化为xml文档? 就是提交上word文档,将word文档转为可以直接使用的xml文档,不是直接修改后缀名的 解决方案 IO读取word,解析内容,拼写xml,IO写入xml. 解决方案二: 把word文档解析出来,重新构建想要的XML格式,然后写出文件 解决方案三: 搞个开元项目 poi 或者 jacob 然后在转xml

java 生成word文档并且在线预览的问题

问题描述 我遇到了这样一个棘手问题,请求各位帮助. 需求:生成有固定格式的word文档(文字报告类型),然后再将该word文档实现在线预览. 我想到的解决办法是先利用freemarker模板生成word(网上盛行),然后再用jodconverter将word转为pdf,然后再用swftools转换pdf为swf,用flexpaper实现在线预览.然后问题出现了,用freemarker生成的word本质是wordml类型的,无法转化为pdf,大家有没有什么好的建议,请不吝赐教. 问题补充:感谢各位

使用Java读取Word文件的简单例子分享_java

java读取word文档时,虽然网上介绍了很多插件poi.java2Word.jacob.itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用):java2Word.jacob容易报错找不到注册,比较诡异,我曾经在不同的机器上试过,操作方法完全一致,有的机器不报错,有的报错,去他们论坛找高人解决也说不出原因,项目部署用它有点玄:itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法.经过一番选择还是折中点采用rtf最好,毕竟rtf是开源格式,

用java向mysql中导入大量txt数据

问题描述 用java向mysql中导入大量txt数据 用java向mysql中导入大量txt数据大约一百万条,怎样能用jdbc高效的存储,不用jdbc有其他方法也可以,重要的是,快求大神指点一二,尽量不要发百度连接啥的,我差不多都找过了,说的详细点,跪求 解决方案 批处理..什么?批处理还不爽?那就批处理这种语句:insert into XXX(abcdd) values(11111)(222222)(33333)还不爽?那就多线程去跑.一百W数据不大.连本地库应该数秒就可以解决 解决方案二:

word文档-java 获取 word 指定段落所在页码

问题描述 java 获取 word 指定段落所在页码 有word文档(docx),查找某个段落的所在页的页码,用于生成word目录: 或者有比较好的方法可以生成word目录

Java关于word excle中书签的读取

问题描述 Java关于word excle中书签的读取 在客服端上传文档(类型word excle),此时通过什么方法可以得到里面定义的书签.poi /jacob/neko.(上传的文档在服务端不好找物理地址). 解决方案 上传成功之后得获取到文件的物理路径,然后再用poi等技术获取书签

java map如何转为配置文件啊。

问题描述 java map如何转为配置文件啊. 求大神.如何才能将map转化为配置文件,就是不要关服务器,有没有什么办法.设置概率的时候可以直接修改 解决方案 java读取配置文件转为UTF-8 解决方案二: 那你用的时候直接放入properties里然吧,文件路径自己写 解决方案三: 输出成配置文件不行么?

导出word html样式-java导出word含html样式,如何识别html样式

问题描述 java导出word含html样式,如何识别html样式 最近做一个导出word的功能,有些内容是富文本框编辑器里面的,附带样式,也就是数据库里存有html标签样式,我用POI生成word,但是标签原样输出了,怎么做才识别html样式. 有解决这问题的啵?