2 pdfbox pdf-PDFBox解析PDF时,这种编码格式的解析不了unijis-ucs2-hw-h

问题描述

PDFBox解析PDF时,这种编码格式的解析不了unijis-ucs2-hw-h

PDFBox解析PDF时,这种编码格式的解析不了unijis-ucs2-hw-h大家有没有什么 好办法?

解决方案

UniJIS-UCS2-HW-H看上去是韩语,你是不是缺少对应的语言支持

解决方案二:

UniJIS-UCS2-HW-H它是日文的一个编码,解析出来全是乱码,在网上也找了些资料,问题还是没解决。

时间: 2024-12-02 12:23:46

2 pdfbox pdf-PDFBox解析PDF时,这种编码格式的解析不了unijis-ucs2-hw-h的相关文章

javaweb-ObjectMapper解析对象时出错

问题描述 ObjectMapper解析对象时出错 用ObjectMapper解析的对象含List<? extends User> 该怎么解析,直接ObjectMapper mapper = new ObjectMapper();mapper.readValue(json, JsonCapsuleList.class)报错 求大神指点

请教pdfbox解析pdf文件的问题

问题描述 c#使用pdfbox解析pdf文件代码很简单PDDocumentdoc=PDDocument.load("xxx.pdf");//doc.decrypt("111111");PDFTextStripperpts=newPDFTextStripper();returnpts.getText(doc);我用这段代码操作大多数pdf文件都已经成功-----------------------------------------------------------

如何解析pdf或者word文档内容,分章节存进mysql数据库

问题描述 如何解析pdf或者word文档内容,分章节存进mysql数据库 最近在做一个项目,有很多国家标准文档,格式很规范.如下所示: 1 主面内容和适用范围 本 标准 规 定了书脊的定义.内容和设计规则. 2 定义 2.1 书籍 连接书的封面和封四,以缝.钉.粘或其它方法装订而成的转折部位. 2.2 边缘名称 出版物封四上沿书脊边缘纵排的书脊名称. 3 设计和使用 3.1 ...... 3.2 ...... 如何解析文档内容,分章节存进mysql数据库的不同字段中,用java编写. 解决方案

java 用IText解析pdf 怎么获取表单坐标

问题描述 java 用IText解析pdf 怎么获取表单坐标 java可以用iText解析pdf, PdfReader reader = new PdfReader("pdf文件的url"); PdfStamper ps = new PdfStamper(reader, bos); AcroFields s = ps.getAcroFields(); 可以通过s.getFields().get("jkrxm")之类的对表单进行操作,有没有可以根据表单的key获得表单

java做 pdf转换成图片 时出现Unknown CMap: UniGB-UCS2-H?急~

问题描述 java做 pdf转换成图片 时出现Unknown CMap: UniGB-UCS2-H?急~ java.io.IOException: Unknown CMap: UniGB-UCS2-H at com.sun.pdfview.font.PDFCMap.getCMap(PDFCMap.java:67) at com.sun.pdfview.font.PDFFontEncoding.(PDFFontEncoding.java:73) at com.sun.pdfview.font.PD

大家帮帮忙。-java 解析pdf 从中抽取出表格的信息,大神怎么做

问题描述 java 解析pdf 从中抽取出表格的信息,大神怎么做 通过解析pdf,将pdf中的表格.图片.文字进行分类提取.怎么做? 解决方案 一般使用开源的iText库来读取PDF文档

java pdf转化为swf时,程序报生成swf文件,在对应的路径下,没生成swf文件,什么原因

问题描述 java pdf转化为swf时,程序报生成swf文件,在对应的路径下,没生成swf文件,什么原因 图片说明](http://img.ask.csdn.net/upload/201605/10/1462847159_88612.png) 解决方案 doc.pdf转换为swf文件预览 解决方案二: 不要考虑swf格式了,快要被淘汰了

[ITextSharp 问题]用itextsharp 5.0.6 不知道如何获取PDF页面的内容,当PDF类型为Distiller时

问题描述 大家好:Itextsharp为开源的软件,代码下载地址为:http://sourceforge.net/projects/itextsharp/files/itextsharp/iTextSharp-5.0.6/itextsharp-5.0.6.zip/download如何获取1571PDF的内容通过itextsharp5.0.6来解析,此PDF类型为distiller.PDF全名:1571es.pdf下载地址:http://www.fda.gov/downloads/AboutFDA

C#怎么解析PDF文件中的线段之类的图元?

问题描述 各位,我想解析PDF文件中的图形,网上有一大堆都是读取pdf文件里面的文字,或者顶多是图片之类的.但是我想要的是,读取PDF文件里面的CAD图纸:例如一个圆.一个线段.或者一段弧.其实也就是,想把这个PDF文件经过解析,生成同样的CAD文件.现在的问题就是:怎么获取里面线段.圆.圆弧等图元,获取图元的坐标信息,然后写到CAD文件里面(写到CAD这个很简单).说白了,就是这么把PDF文件里面的内容转换成CAD图纸.网上也有一些工具,但是效果不是很好,有的还是破解的.求助啊~~~~~~~~