问题描述
我看了这个帖子http://www.javaeye.com/topic/333676说是可以实现pdf转换成html,我目前也确实实现了转换,但是只局限于英文的pdf,中文的就不行了,转换后的html一片空白,。很困惑,,,我的代码如下:importjava.io.File;importjava.io.IOException;publicclassConvertPdf{privatestaticStringINPUT_PATH;privatestaticStringPROJECT_PATH;publicstaticvoidconvertToHtml(Stringfile,Stringproject){INPUT_PATH=file;PROJECT_PATH=project;if(checkContentType()==0){toHtml();}}privatestaticintcheckContentType(){Stringtype=INPUT_PATH.substring(INPUT_PATH.lastIndexOf(".")+1,INPUT_PATH.length()).toLowerCase();if(type.equals("pdf"))return0;elsereturn9;}privatestaticvoidtoHtml(){if(newFile(INPUT_PATH).isFile()){try{Stringcmd="cmd/cstartc:\xpdf\pdftohtml.exe-encUTF-8""+INPUT_PATH+""""+PROJECT_PATH+""";Runtime.getRuntime().exec(cmd);}catch(IOExceptione){e.printStackTrace();}}}publicstaticvoidmain(String[]args){ConvertPdfcpdf=newConvertPdf();ConvertPdf.convertToHtml("C:\o.pdf","c:\b.html");}}
我感觉不是代码的问题,有可能是配置的问题,有个中文的配置文件,我我不知道该如何配置!!!文件如下:#-----beginChineseSimplifiedsupportpackagecidToUnicodeAdobe-GB1xpdf-chinese-simplifiedAdobe-GB1.cidToUnicodeunicodeMapISO-2022-CNxpdf-chinese-simplifiedISO-2022-CN.unicodeMapunicodeMapEUC-CNxpdf-chinese-simplifiedEUC-CN.unicodeMapunicodeMapGBKxpdf-chinese-simplifiedGBK.unicodeMapcMapDirAdobe-GB1xpdf-chinese-simplifiedCMaptoUnicodeDirxpdf-chinese-simplifiedCMapfontDirC:WINDOWSFontsdisplayCIDFontTTAdobe-GB1C:WINDOWSFontssimhei.ttf#-----endChineseSimplifiedsupportpackage谢谢各位老大,小弟感激不尽呵呵
解决方案
解决方案二:
这个问题确实比较困难。。
解决方案三:
没人了吗我可以再加分。。两天了