问题描述
急求,要求为标准的html样式,去除无用代码
解决方案
解决方案二:
protectedvoidConvertToText(){//定义Word对象Microsoft.Office.Interop.Word.ApplicationClasswordApp=newMicrosoft.Office.Interop.Word.ApplicationClass();//要转换的文件名objectfileName="E:\C#\test.doc";//默认值objectmiss=System.Reflection.Missing.Value;//打开要转换的DOC文件Microsoft.Office.Interop.Word.DocumentClassdoc=(Microsoft.Office.Interop.Word.DocumentClass)wordApp.Documents.Open(reffileName,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss);//转换后的文件名fileName="E:\C#\testDoc.txt";//保存的文件格式objectsaveFormat=WdSaveFormat.wdFormatHTML;//按文本文件保存doc.SaveAs(reffileName,refsaveFormat,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss,refmiss);//关闭是否保存文件,这里为不保存objectchanges=false;//关闭文件doc.Close(refchanges,refmiss,refmiss);//退出Word应用程序wordApp.Quit(refchanges,refmiss,refmiss);}c#的,你转下吧
解决方案三:
//转换后的文件名fileName="E:\C#\testDoc.html";//转换后的文件名
解决方案四:
非常感谢你,我需要的是怎样清除生成后的无关的Html代码,请大家帮忙啊!!!
解决方案五:
什么代码算无用的呢?样式是否要去掉呢?
解决方案六:
无关的HTML代码很难去除的,这要做HTML代码解析。微软的WORD组件肯定不会帮你做这个事儿,这事儿都被做了,那大家都不用OFFICE拉:)我觉得这个时间做起来复杂度很高,不推荐你这么做。
解决方案七:
一楼的解决方法不错你可以试试.