问题描述
我需要把这段html文件格式化:<html><head><metaHTTP-EQUIV="Content-Type"CONTENT="text/html;charset=gb2312"><linkrel=stylesheettype=text/csshref="/images/bbs.css?Net_3"></head><body><script>Net.Html.show('bbshead')</script><script>Net.CC.init('70%,30%','_logo,0,0,0;_good,0,1,0;_forum,0,2,0;_recBrd,1,0,0;_act,1,1,0;_top10,1,2,0;_hotBrd,1,3,0')</script><tablewidth="100%"border="0"cellpadding="0"cellspacing="1"class="TabBest"><tr><tdalign="center"class="TabBody1"><embedsrc=/file/LilyDevelop/bottombanner.swfquality=highwidth=760height=76></embed></td></tr></table></body></html>期望的结果为:<html><head><metaHTTP-EQUIV="Content-Type"CONTENT="text/html;charset=gb2312"><linkrel=stylesheettype=text/csshref="/images/bbs.css?Net_3"></head><body><script>Net.Html.show('bbshead')</script><tablewidth="100%"border="0"cellpadding="0"cellspacing="1"class="TabBest"><tr><tdalign="center"class="TabBody1"><embedsrc=/file/LilyDevelop/bottombanner.swfquality=highwidth=760height=76></embed></td></tr></table></body></html>求教各位达人,使用Java正则表达式应当怎么解决补充一下,我想要的结果是每个子节点都要相对于它的父节点缩进四个字符,但是放到这边显示不出来那个效果了,大家明白就好
解决方案
本帖最后由 xiaodandanbai 于 2011-05-06 13:13:26 编辑
解决方案二:
用正则做没啥思路。倒是如果用xml解析工具的话应该可以吧。比如dom4j
解决方案三:
建议用,ParserDelegator效果不错扩展HTMLEditorKit.ParserCallback作回调,我在做邮件软件时,收html的内容都用它整理再显示,效果不错