问题描述
使用IO流将doc文档中的内容读取出来,并在终端显示~~~由于直接使用流进行读取的话,不论是选择“GBK”还是“UTF-8”编码,均出现一堆乱码!谢谢代码如下:<pre>public static void copy() throws IOException{ BufferedReader bufis = new BufferedReader(new InputStreamReader(new FileInputStream("12.doc"), "utf-8")); String line = null; while ((line = bufis.readLine())!=null){ System.out.println(line); } }</pre> 问题补充:<div class="quote_title">janeky 写道</div><div class="quote_div">兄弟,doc文件是有专门的文件格式的,<br /><br />不是普通的文本文档,读出来当然是乱码了。<br /><br />你可以将doc的文件内容复制到 普通的txt文件保存,<br /><br />或者找找其他jar包来解析doc</div><br />哦 好的 谢谢
解决方案
使用jacob来操作word应该不错
解决方案二:
兄弟,doc文件是有专门的文件格式的,不是普通的文本文档,读出来当然是乱码了。你可以将doc的文件内容复制到 普通的txt文件保存,或者找找其他jar包来解析doc