关于使用java正则表达式格式化html文档

问题描述

我需要把这段html文件格式化:<html><head><metaHTTP-EQUIV="Content-Type"CONTENT="text/html;charset=gb2312"><linkrel=stylesheettype=text/csshref="/images/bbs.css?Net_3"></head><body><script>Net.Html.show('bbshead')</script><script>Net.CC.init('70%,30%','_logo,0,0,0;_good,0,1,0;_forum,0,2,0;_recBrd,1,0,0;_act,1,1,0;_top10,1,2,0;_hotBrd,1,3,0')</script><tablewidth="100%"border="0"cellpadding="0"cellspacing="1"class="TabBest"><tr><tdalign="center"class="TabBody1"><embedsrc=/file/LilyDevelop/bottombanner.swfquality=highwidth=760height=76></embed></td></tr></table></body></html>期望的结果为:<html><head><metaHTTP-EQUIV="Content-Type"CONTENT="text/html;charset=gb2312"><linkrel=stylesheettype=text/csshref="/images/bbs.css?Net_3"></head><body><script>Net.Html.show('bbshead')</script><tablewidth="100%"border="0"cellpadding="0"cellspacing="1"class="TabBest"><tr><tdalign="center"class="TabBody1"><embedsrc=/file/LilyDevelop/bottombanner.swfquality=highwidth=760height=76></embed></td></tr></table></body></html>求教各位达人,使用Java正则表达式应当怎么解决补充一下,我想要的结果是每个子节点都要相对于它的父节点缩进四个字符,但是放到这边显示不出来那个效果了,大家明白就好

解决方案

本帖最后由 xiaodandanbai 于 2011-05-06 13:13:26 编辑
解决方案二:
用正则做没啥思路。倒是如果用xml解析工具的话应该可以吧。比如dom4j
解决方案三:
建议用,ParserDelegator效果不错扩展HTMLEditorKit.ParserCallback作回调,我在做邮件软件时,收html的内容都用它整理再显示,效果不错

时间: 2024-08-01 21:14:19

关于使用java正则表达式格式化html文档的相关文章

仔细触摸Java编程中的“文档”和“包”

编程 什么是包 Java中的包(Package)其实指的就是目录,它是为了更好地管理Java类(Class)和接口(Interface).Java语言的包可以被另一个Java开发包所使用.如果我们要引用某个包中的类,用import关键字来标明即可.比如: import java.util. date=new Date  提示:import java.util.表示java.util中的所有公有类和接口被引入到当前包.这里的匹配符可以调入多个类名. 常用的Java标准包 JDK为我

Java程序把Word文档直接转换成HTML文件

word|程序|转换 Jacob是Java和Windows下的Com桥,通过它我们可以在Java程序中调用COM组件.如果你的JDK是1.4,那你需要下载Jacob1.9的jni库才能正常运行,早期版本在JDK1.4下有些问题. package com; /*** 〈p〉Title:Word文档转html类〈/p〉* 〈p〉Description: 〈/p〉* 〈p〉Copyright:() 2002〈/p〉* @author 舵手* @version 1.0*/import com.jacob

Java中的XML: 文档模型,第一部分:性能

使用内存中 XML 文档的 Java 开发者可以选择使用标准 DOM 表示或几个 Java 特定模型中的任何一个.该灵活性已经帮助将 Java 建立成 XML 工作的出色平台.但是,由于不同模型数量的增加,已经更加难以确定如何比较模型的功能.性能和易用性. 关于使用"Java 中的 XML"系列中的第一篇文章研究了 Java 中一些领先的 XML 文档模型的特性和性能.它包括一组性能测试的结果.在系列中的第二篇文章将通过比较为实现同样任务所使用的不同模型的样本代码来研究易用性问题. 文

使用CSS样式表格式化XML文档

 这篇文章适用于有一定CSS基础的朋友们.如果你还没有CSS基础,可以到中文w3schools进行学习.      1.XML中引入CSS样式.      在XML中引入CSS样式表有两种方法.一种是在XML文档中直接嵌入CSS样式:另一种则是外部引入(似乎在WEB中很多引入的方式都有这两种).在XML中直接嵌入CSS样式的方法如下:  1 <?xml version="1.0" encoding="utf-8"?> 2 <?xml-stylesh

java类的问题-JAVA我想用java创建一个txt文档

问题描述 JAVA我想用java创建一个txt文档 我想用java创建一个txt文档,并生成它,在JAVA源程序目录下可以找到.怎么在txt文档中把JTextARea中的内容写入里面.`

java jacob对word文档操作时怎样选中全文

问题描述 java jacob对word文档操作时怎样选中全文 用做一个对word操作的程序,一切顺利,就是需要选中全文时卡住了,查了很对资料找不到相关方法.请大神指教!

利用Java动态生成 PDF 文档

利用Java动态生成 PDF 文档,则需要开源的API.首先我们先想象需求,在企业应用中,客户会提出一些复杂的需求,比如会针对具体的业务,构建比较典型的具备文档性质的内容,一般会导出PDF进行存档.那么目前最佳的解决方案,你可能会想到 iText ,对没错... iText+(Velocity / Freemarker)可以实现.不过据我熟悉,iText本身提供的HTML解析器还是不够强大,许多HTML标签和属性无法识别,更悲催的是简单的CSS它不认识,排版调整样式会让你头大的.不要失望,接下来

java中从txt文档中提取出来的内容可以在控制台输出,但不能写入到另一个txt文档中

问题描述 java中从txt文档中提取出来的内容可以在控制台输出,但不能写入到另一个txt文档中 import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.FileWriter; import java.io.IOException

在Java中轻松打印文档

有关在Java中实现文档打印的典型说法描述了一个复杂的过程,它要求对字 体进行测定.对文本进行解析并将结果绘制到一个Graphics对象中.这个过程似 乎执行起来相当困难,并且它和用于文档视频显示的高级编程方法不一致.如果 你想要花费大量的精力来完成这个过程,那么你就不会首先想到要在Java中编程 . 你一定不想自己完成测定.解析和绘制过程,而是希望通过简单地将文档发 送到一个能为你处理所有事情的对象中来完成这个任务.本文就将介绍这样一个 对象――DocumentRenderer,它将一个文档作