正则表达式过滤html的标签对

   public string DealHtml(string str)
{
//str = Regex.Replace(str, @"<(img)[^>]*>|</(img)>", "", RegexOptions.IgnoreCase);
str = Regex.Replace(str, @"<(table|tbody|tr|td|th)[^>]*>|</(table|tbody|tr|td|th)>", "", RegexOptions.IgnoreCase);
str = Regex.Replace(str, @"<(div|blockquote|fieldset|legend)[^>]*>|</(div|blockquote|fieldset|legend)>", "", RegexOptions.IgnoreCase);
//str = Regex.Replace(str, @"<(font|i|u|h[1-9]|s)[^>]*>|</(font|i|u|h[1-9]|s)>", "", RegexOptions.IgnoreCase);
//str = Regex.Replace(str, @"<(style|strong)[^>]*>|</(style|strong)>", "", RegexOptions.IgnoreCase);
//str = Regex.Replace(str, @"<a[^>]*>|</a>", "", RegexOptions.IgnoreCase);
//str = Regex.Replace(str, @"<(meta|iframe|frame|span|tbody|layer)[^>]*>|</(iframe|frame|meta|span|tbody|layer)>", "", RegexOptions.IgnoreCase);
str = Regex.Replace(str, @"<br[^>]*", "", RegexOptions.IgnoreCase);
str = str.Replace("<br>", "");
return str;
}

时间: 2024-08-26 22:06:57

正则表达式过滤html的标签对的相关文章

asp.net 过滤所有html标签正则表达式

asp教程.net 过滤所有html标签正则表达式 //下面提供二种asp.net教程 过滤所有html标签正则表达式,都是过滤所有html代码,用的是replace替换. regex reg = new regex(@"(?is)<span[^>]*>(.*?)</span>"); matchcollection mc = reg.matches(""); foreach (match m in mc) {   str+= m.gro

PHP正则表达式过滤html标签属性(DEMO)_php实例

过滤html标签在php中可以有内置的函数了,但它过滤的太干净了,我们就整理了一下些利用正则来过滤指定html标签的例子,具体如下所示. 采集的时候有时候需要过滤掉多余的标签属性,比如 img标签过滤掉除了src属性之外的所有属性例如删除titile alt等属性以及一些脚的onclick属性等. 例如 过滤除了src之外的所有属性: 复制代码 代码如下: $str= preg_replace('/\s(?!src)[a-zA-Z]+=[\'\"]{1}[^\'\"]+[\'\&quo

php正则表达式过滤html标签属性

采集的时候有时候需要过滤掉多余的标签属性,比如 img标签过滤掉除了src属性之外的所有属性例如删除titile alt等属性以及一些脚的onclick属性等. 例如过滤除了src之外的所有属性 $str= preg_replace('/\s(?!src)[a-zA-Z]+=[\'\"]{1}[^\'\"]+[\'\"]{1}/iu',' $str); 上面的实例代码是过滤掉除了src属性外的所有标签属性 过滤设置过滤除了alt和src之外的所有属性,代码如下: $str =

C#使用正则表达式过滤html标签_C#教程

在项目中遇到这样一个需求,需要将一段html转换为一般文本返回,万能的正则表达式来了. 正则表达式来拯救你,代码如下: public static string Html2Text(string htmlStr) { if (String.IsNullOrEmpty(htmlStr)) { return ""; } string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //定

java使用正则表达式过滤html标签_java

前段时间开发的时候要读取一篇文章的简介内容(也就是前200个字符),使用了隐藏字段,可能有人就要问了,那后台也是可以截取字符的啊,那是因为编辑器里面包含了html标签,所以后台就需要处理html标签的正则表达式,前些天上网搜了下,发现有人写好的一个类,给大家共享下,不要闲小弟落伍了... import java.util.regex.Matcher; import java.util.regex.Pattern; /** * <p> * Title: HTML相关的正则表达式工具类 * <

php过滤所有html标签的几种方法

//用正则过滤html标签  代码如下 复制代码 $html_body ="<a href='#'>www.111cn.net</a>"; preg_replace("/(</?)(w+)([^>]*>)/e",              "'\1'.strtoupper('\2').'\3'",              $html_body);     //用php教程自带函数strip_tags  

用php过滤所有html标签属性

//1,过滤所有html标签的正则表达式: </?[^>]+> //2,过滤所有html标签的属性的正则表达式: $html = preg_replace("/<([a-zA-Z]+)[^>]*>/","<\1>",$html); //3,过滤部分html标签的正则表达式的排除式(比如排除<p>,即不过滤<p>): </?[^pP/>]+> //4,过滤部分html标签的正则表

ASP正则表达式清除HTML指定标签的方法_应用技巧

在HTML编辑器发布过程中,会出现一些自动生成的HTML标签,或者在留言板程序应用过程中,也会出现有人恶意写入一些HTML代码的情况,所以怎么精准的过滤掉某些特定的属性标签和参数呢?下面是代码: <% Function ReplaceText(fString,patrn,replStr) Set regEx = New RegExp ' 建立正则表达式. regEx.Pattern = patrn ' 设置模式. regEx.IgnoreCase = True ' 设置是否区分大小写. regE

ASP正则表达式清除HTML指定标签的方法

在HTML编辑器发布过程中,会出现一些自动生成的HTML标签,或者在留言板程序应用过程中,也会出现有人恶意写入一些HTML代码的情况,所以怎么精准的过滤掉某些特定的属性标签和参数呢?下面是代码: <% Function ReplaceText(fString,patrn,replStr) Set regEx = New RegExp ' 建立正则表达式. regEx.Pattern = patrn ' 设置模式. regEx.IgnoreCase = True ' 设置是否区分大小写. regE