文档-关于JAVA的POI处理.doc、.docx时office和wps的不同处理

问题描述

关于JAVA的POI处理.doc、.docx时office和wps的不同处理

比如用户发过来一个doc文档,但是我现在不知道他是wps的还是word的,这两个会有略微不同。
那我用poi处理时应该怎么做?可以识别吗?
我查了一下文档没有找到这部分的。。。大多网上的例子都是知道上传的是wps还是word。
我试了下发现不进行分类处理好像会有乱码。。。

解决方案

--上传文件
客户端上传文件到服务端,服务端可以获取到当前上传文件的文件名称、文件对象、文件类型等属性,判断文件的后缀区分当前上传的文件
是word文件还是wps文件,根据判断结果对文件分类进行解析。
wps文件的后缀:*.wpt;
word文件的后缀:*.doc(2003及以下的版本);*.docx(2003以上的版本)

解决方案二:

并不啊,wps可以编辑word文档,然后里面的编码可能会改变,然后我会弄成乱码。

时间: 2024-09-03 04:46:50

文档-关于JAVA的POI处理.doc、.docx时office和wps的不同处理的相关文章

区分-上传到服务器的doc文档,java怎么判断是office还是wps生成的

问题描述 上传到服务器的doc文档,java怎么判断是office还是wps生成的 office 和wps 生成的doc 传到服务器 都是 application/msword的,但是程序只能给office的加水印 有没有其他判断方法 解决方案 应该是doc文件里面有一个标志字段记录了制作是通过msoffice还是其他等等的office 解决方案二: 具体怎么做我还没琢磨明白,但发现一个事实是,分别用word和wps创建的doc,右键.属性里的摘要信息,有一个应用程序名称,分别是: Micros

语音读取文档技术java技术的开发

问题描述 语音读取文档技术java技术的开发 我想做一个语音读取,电子书的开发软件 ,就是想问问,现在的这些软件开发的优缺点在什么地方? 解决方案 主要的难题是朗读,毕竟机器的智能不如人类,读起来会有些不像. 另外就是电子书的阅读体验不同于纸质书,所以需要优化.举一个简单的例子,人翻阅纸质书寻找一个有插图的章节,可能一秒钟看100页,很快就找到了. 可是电脑的速度有限,你做电子书加载页面肯定有延迟,就达不到这样的流畅度.

Aspose.Pdf.Kit for Java 4.0.0发布 PDF文档的Java组件

Aspose.Pdf.Kit是一个用于处理http://www.aliyun.com/zixun/aggregation/16864.html">PDF文档的Java组件.它支持填补XFA字段,创建PDF文档链接,字体样式,修改AcroForm,提取.添加图片和文字,检索和修改元数据信息,进行加密或解密PDF文件,添加水印或标志,附加页,并可以转换PDF文件到单一的TIFF或XML文件. Aspose.Pdf.Kit for Java 4.0.0版本包含了文本提取相关的两个新功能,提取文本

mfc-MFC多文档应用程序中嵌入cef3,启动时一次性启了三个多文档应用程序

问题描述 MFC多文档应用程序中嵌入cef3,启动时一次性启了三个多文档应用程序 新建多文档应用程序,新增了Dialog,在Dialog的OnCreate中实现 了cef的CefExecuteProcess.CefInitialize.CreateBrowser,编译无误,结果运行时一下启了多文档实例,而且网页也没有显示出来. 附代码: int CTestDlg::OnCreate(LPCREATESTRUCT lpCreateStruct) { if (CDialogEx::OnCreate(

java使用poi读取doc和docx文件

这几天在学习java io流的东西,有一个网友看到博客后问了一个问题,就是说他的doc文档为什么用我所说的方法死活就是乱码. 我一开始以为是他方法问题,结果自己试了之后发现和他的结果一样也是乱码. 于是在网上搜寻了一阵之后才发现原来doc文档和excel一样不能用普通的io流的方法来读取,而是也需要用poi,于是进行了一番尝试后,终于以正确的编码格式读取了这个doc文件. 在网上搜索的过程中发现doc和docx的读取方法是不一样的,于是顺带也学了一下docx文件的简单读取. 一.导包: doc文

AKKA文档(java版)——什么是AKKA?

原文:http://doc.akka.io/docs/akka/2.3.6/intro/what-is-akka.htmll  译者:吴京润 可扩展的实时事务处理 我们相信编写并发.容错.可扩展的应用相当的困难.盖因大多数时候我们一直在使用错误的工具和错误的抽象等级.AKKA就是为了改变这一切的.我们利用角色模型提升了抽象等级,并且提供了一个用来构建可扩展的.弹性的以及响应式应用的更好的平台--更多信息请见Reactive Manifesto.对于容错机制我们采用"让它崩溃"模型,这一

AKKA文档(java版)—角色

原文地址  译者:Zhanggc      审校:吴京润 角色 角色模型对编写并发.分布式系统进行了高度抽象.它减轻了开发者必须对互斥锁与线程管理的负担,更容易编写出正确的并发与并行系统.早在1973 年 Carl Hewitt 发表的论文中定义了角色,但一直流行于Erlang 语言中,随后被爱立信公司应用于建立高并发.可靠通信系统,取得了巨大成功. Akka 框架里面角色的API 跟Scala 框架里面角色相似,后者一些语法曾经模仿Erlang语言. 创建角色 注意:由于Akka强迫父级监管者

AKKA文档(java)——术语,概念

原文:http://doc.akka.io/docs/akka/2.3.6/general/terminology.html 译者:吴京润 本章我们试图建立一个通用的术语列表,用来定义有关并发和分布式系统的坚实的基础,而这也是akka的目标.请注意,在这些术语当中许多并没有一致的定义.我们简单的寻求在akka文档范围内使用的工作定义. 并发与并行 并发与并行是相关的概念,但是也有很多细节上的差异.并发意味着两个或更多的任务正在取得进展,即使它们不是同时执行的.例如,可以用时间片的方式实现这一点,

AKKA文档(Java版)—建立有限状态机角色

原文地址  译者:Zhanggc 建立有限状态机角色 概述 有限状态机模式在Erlang design principles里面被很好描述出来.简而言之,它可以被视为一组关系: State(S) x Event(E) -> Actions (A), State(S') 这些关系描述为: 如果我们在状态S 和 时间E 发生,我们应该执行动作A 与转换到状态S'. 而Scala 程序语言使构建一个良好内部DSL(领域特定语言)成为可能,后者用于规划有限状态机(请见FSM).对于用同样方法,由于Jav