用正则表达式剔除文本中的HTML标记

因为我的前段时间发的XMLHTTP批量抓取远程资料的文章
http://blog.111cn.net/babyt/archive/2004/09/08/98516.aspx
最近有人来问我如何将文章用文本格式保存，而不是直接使用HTML存储，这样的话会节约数据库空间．于是写了这么个函数来将文本中的HTML标记剔除
函数虽然简单，但是对处理HTML文档还是很有效的
<%
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp

objRegExp.IgnoreCase = True
objRegExp.Global = True
'取闭合的<>
objRegExp.Pattern = "<.+?>"
'进行匹配
Set Matches = objRegExp.Execute(strHTML)

' 遍历匹配集合，并替换掉匹配的项目
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
%>

时间： 2024-10-12 03:28:33

用正则表达式剔除文本中的HTML标记的相关文章

如何使用正则表达式剔除文本中的HTML标记

html标记|正则因为我的前段时间发的XMLHTTP批量抓取远程资料的文章http://blog.csdn.net/babyt/archive/2004/09/08/98516.aspx最近有人来问我如何将文章用文本格式保存,而不是直接使用HTML存储,这样的话会节约数据库空间．于是写了这么个函数来将文本中的HTML标记剔除函数虽然简单,但是对处理HTML文档还是很有效的<%Function RemoveHTML(strHTML) Dim objRegExp, Match, Matches

正则表达式——去除文本中的非汉字（VB2005）

本人由于工作关系,需要一段代码,将给定的字符串中的非汉字去除,只保留汉字部分. 这个一般用正则表达式比较简单,网上有一些匹配汉字的正则表达式,拿来经过改造就能实现我前面的要求. 注释一下,正则表达式[\u4e00-\u9fa5]表示匹配中文,则正则表达式[^\u4e00-\u9fa5]匹配非中文.用Replace方法将匹配的非中文替换为空字符串,也就是去除了文本中的非中文字符. 代码格式修正于2012年1月5日 Imports System.Text.RegularExpressionsPub

判断文本中不存在指定字符串(忽略大小写)的正则表达式的问题

问题描述判断文本中不存在指定字符串(忽略大小写)的正则表达式的问题最近遇到个正则表达式的问题,判断不存在指定字符串的正则表达式是这样:((?!MySQL).)*,但忽略大小写判断(?!)加上去后,死活不成功,((?!(?!)MySQL).)*,这个是加上忽略大小后的写法,谁能帮我看看到底是怎么回事解决方案 ?i 这个应该是忽略大小写的解决方案二: 谢谢,才发现我写错了,?i写成?!

《正则表达式经典实例（第2版）》——2.20　在替代文本中添加正则匹配

2.20 在替代文本中添加正则匹配问题描述执行查找和替换,把所有URL都转换成指向该URL的HTML链接,并使用该URL作为链接的文本.在这个练习中,把URL定义为"http:"以及其后所有的非空字符.例如,Please visit应该被转换为Please visit. 解决方案正则表达式 http:\S+ 正则选项:无正则流派:.NET.Java.JavaScript.PCRE.Perl.Python.Ruby 替代文本 <a●href="$&&quo

《正则表达式经典实例（第2版）》——2.19　在替代文本中添加字面文本

2.19 在替代文本中添加字面文本问题描述查找并把任何正则表达式匹配从字面上替换为这8个字符:$%*$11. 解决方案 $%\*$$1\1 替代文本流派:.NET.JavaScript \$%\\*\$1\\1 替代文本流派:Java $%\*\$1\\1 替代文本流派:PHP \$%\*\$1\\1 替代文本流派:Perl $%\*$1\\1 替代文本流派:Python.Ruby 讨论在替代文本中转义字符的时机和方式这个实例显示了各种替代文本流派中使用的不同转义规则.在替代文本中,你可能会需

《正则表达式经典实例（第2版）》——2.21　把部分的正则匹配添加到替代文本中

2.21 把部分的正则匹配添加到替代文本中问题描述匹配任意10个数字的连续序列,如1234567890.并把这个序列转换成(美国)电话号码的常见格式,如(123) 456-7890, 解决方案正则表达式 \b(\d{3})(\d{3})(\d{4})\b 正则选项:无正则流派:.NET.Java.JavaScript.PCRE.Perl.Python.Ruby 替代文本 ($1)●$2-$3 替代文本流派:.NET.Java.JavaScript.PHP.Perl (${1})●${2}-$

《正则表达式经典实例（第2版）》——2.22　把匹配上下文插入到替代文本中

2.22 把匹配上下文插入到替代文本中问题描述创建一个替代文本,用来把正则表达式匹配的文本替换为匹配之前的文本紧跟完整目标文本再紧跟匹配之后的文本.例如,如果在BeforeMatchAfter中找到的是Match,那么把这个匹配换成BeforeBeforeMatchAfterAfter,最终得到的新文本是BeforeBefore BeforeMatchAfterAfterAfter. 解决方案 $`$_$' 替代文本流派:.NET.Perl \`\`\&\'\' 替代文本流派:Ruby $`$

ASP小偷程序需要用到的函数：用于可控制删除文本中的html标签

程序|函数|控制|小偷程序函数用于去除文本中的html标签,可以控制删除哪些标签. 要控制被删除的标签列表,可以通过向TAGLIST常数中添加/删除标记来实现. 例如,要保留所有的<B>标签,则从TAGLIST中删除B. 当前的列表包含了MSDN中的所有html标签以及 LAYER 标签. 每个标签要用";"括起来. 开始标签和结束标签都会被删除,例如"<A...>"和</A...> 若标签同时在 TAGLIST 和 BLOCK

html-怎样用正则表达式提取HTM中的部分数据

问题描述怎样用正则表达式提取HTM中的部分数据怎样用正则表达式从一个Html 中提取一些想要的数据,正则表达式该写在哪里呢解决方案 /<(.*)>.*</1>/ "<(.*)>.*</1>" 匹配一个 HTML 标记. 解决方案二: 你是用什么语言,想提取什么标签内的内容解决方案三: 问这种问题应该给出示例的html代码片断,以及你希望提取的数据,还有你用的编程语言,才好帮助到你. 你什么都不说,只能给你一个泛泛的解答了:在goo

猜你喜欢

JAVA中面向对象编程语言的学习之路

编程|对象第一步是安装好JDK 写一个Hello World,? 其实JDK的学习没有那么简单,关于JDK有两个问题是很容易一直困扰Java程序员的地方:一个是CLASSPATH的问题,其实从原理上 ...

ASP内置对象Request和Response详解

request|response|对象|内置对象|详解|内置对象 Request和Response这两个对象是ASP所提供的内置对象中最常用的两个.在浏览器(或其他用户代理)和Web服务器之间 ...

比比猫朱明谦：“猫”背上的搜索人生

2006年8月26日这一天,对于33岁的新加坡人朱明谦而言,他创立仅一年的聚类搜索互联网公司bbmao入选美国著名风险投资杂志Red Herring"2006亚洲百强",这也意味着 ...

别样温情把MM照片和日历放在桌面上

日历近日有位较有意思的女顾客,她的要求很简单,希望通过电脑艺术处理,将自己的照片修饰冲印,再裱上画框,放在BF(男友)的办公桌上.这本是件很容易的事,不过以9527绝顶的创意头脑,给MM建议了一番: ...

php设计模式 Mediator (中介者模式)

复制代码代码如下: <?php /** * 中介者模式 * * 用一个中介对象来封装一系列的对象交互,使各对象不需要显式地相互引用从而使其耦合松散,而且可以独立地改变它们之间的交互 */ ab ...

编写通用的ASP防SQL注入攻击程序

程序|攻击 SQL注入被那些菜鸟级别的所谓黑客高手玩出了滋味,发现现在大部分黑客入侵都是基于SQL注入实现的,哎,谁让这个入门容易呢,好了,不说废话了,现在我开始说如果编写通用的SQL防注入程序一般的 ...

使用VS.NET2003创建数据库图

Visual Studio .NET 2003 的众多优势之一是,用户可将其用作主要的 SQL Server 编辑器来完成大多数任务.获得目标数据库服务器的适当权限后,您就可以轻松地使用 Visual ...

PhotoShop制作放射爆炸文字特效教程

效果预览: 怎么样?很酷的效果吧?嘿嘿!下面教大家制作方法. 一.设置前景色为白,背景色为黑(快速方法:点击"默认前景色和背景色",然后再点击"切换前景色和背景色&quo ...

使用 Mac 从其他设备接受蓝牙文件

不知道您是否尝试过用其他设备通过蓝牙发送文件到Mac.(Apple Fans表示我们可以用Air Drop,iCloud....) 但如果您曾经尝试过,但又很不解为什么设备总是提示"对方 ...

声卡的噪音大

声卡在正常使用中,噪音越来越大.而引起这种故障的原因有很多,主要有以下几个方面. 1.声卡抗干扰能力差.杂牌声卡的做工.用料都不好,容易受到其他设备的电磁干扰.这种情况除了更换质量好的声卡,还可以 ...

可编程渲染管线与着色器语言

Programming pipeline & shading language 大家好,今天想给大家介绍一下可编程渲染管线和着色器语言的相关基础知识,使想上手SHADER编程的童鞋们可以快速揭 ...

java 字符串匹配函数_正则表达式

去掉字符串中匹配的字符串复制代码代码如下: /** * 去掉字符串中匹配的字符串 * * @author zhujie * @return String regex 要替换的内容 value ...

Discuz!NT 论坛整合ASP程序论坛_应用技巧

复制代码代码如下: <%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%> <!--#include virtu ...

这是arm的最简单的点LED代码，但是却有很奇怪的现象

问题描述这是arm的最简单的点LED代码,但是却有很奇怪的现象加上".data"后bin文件居然有33kb不加".data"有1kb,程序无反映,代码是在L ...

注册表-点击包含firefox.exe字符的lnk却打开了ie

问题描述点击包含firefox.exe字符的lnk却打开了ie 1.我的快捷方式指向目标没错 2.我直接双击firefox.exe能正确打开火狐 3.我通过命令行运行该快捷方式能正确打开火狐 4.如 ...

用c语言编写一个数组排序函数要求如下

问题描述用c语言编写一个数组排序函数要求如下 1.既能从小到大也能从大到小 2.对int,unsigned int,const int,double 等类型数组都适用 3.尽量简洁解决方案参考 ...

java的查询问题

问题描述 SQLException: Unknown column '保险丝' in 'where clause'SQLState: 42S22VendorError: 1054数据库使用的是mysq ...

easyui-ASP.NET。。。。。。。

问题描述 ASP.NET....... 刚接触AASP.NET.以前都是用拖控件的方式做页面,现在想用EASYUI做前台,那是不是就不能用WEBFORM的事件驱动模式了啊.是的话怎么实现前后台的数据交 ...

《请君入瓮——APT攻防指南之兵不厌诈》目录—导读

版权声明请君入瓮--APT攻防指南之兵不厌诈 Sean Bodmer, Dr. Max Kilger, Gregory Carpenter and Jade Jones Reverse Decept ...

小米笔记本曝光，称售价3999元

在之前就有消息称,小米将会推出一款笔记本电脑,这款笔记本仍将走高性价比线路.现在这款笔记本的样机已经曝光,据小道消息称,该机将采用Intel最新的Haswell Core i7处理器,4GB DDR ...

c# 传值类-C#如何将一个窗体中的字符串传到存放许多方法的类中?

问题描述 C#如何将一个窗体中的字符串传到存放许多方法的类中? C#如何将一个窗体中的字符串传到存放许多方法的类中.传值解决方案很多方法: 1,把字符串做出静态字段 2,用个单例类把字符串 ...

api-odata用expand没有效果

问题描述 odata用expand没有效果在web api中使用odata的$expand没有作用................ 解决方案表里没有外键吧,试试加个外键

允许外资企业从事游戏游艺设备的生产和销售

4月21日消息,上海市政府日前公布了<中国(上海)自由贸易试验区文化市场开放项目实施细则>,细则规定,允许外资企业从事游戏游艺设备的生产和销售,通过文化主管部门内容审查的游戏游艺设备可面向 ...

mysqlsla慢查询分析工具使用笔记_Mysql

且该工具自带相似SQL语句去重的功能,能按照指定方式进行排序(比如分析慢查询日志的时候,让其按照SQL语句执行时间逆排序,就能很方便的定位出问题所在) + ------------- 安装mysqls ...

防止服务器宕机时MySQL数据丢失的几种方案_Mysql

对于多数应用来说,MySQL都是作为最关键的数据存储中心的,所以,如何让MySQL提供HA服务,是我们不得不面对的一个问题.当master当机的时候,我们如何保证数据尽可能的不丢失,如何保证快速的获知 ...

mysql触发器(Trigger)简明总结和使用实例_Mysql

一,什么触发器 1,个人理解触发器,从字面来理解,一触即发的一个器,简称触发器(哈哈,个人理解),举个例子吧,好比天黑了,你开灯了,你看到东西了.你放炮仗,点燃了,一会就炸了.2,官方定义触发器(tr ...

富士康对印尼投资有兴趣暂未提交方案

[搜狐IT消息]北京时间7月26日消息,印度尼西亚工业部长希达亚特(MS Hidayat)25日说,富士康科技集团已表达对投资印度尼西亚的兴趣.希达亚特向记者表示:"我们已派遣小组与富士康会 ...

qwidget的使用-Qt中代码添加多行widget后,删除中间某行余下的怎么才能往上移动??

问题描述 Qt中代码添加多行widget后,删除中间某行余下的怎么才能往上移动?? 如题,比如用代码添加了5行widget,这时候删除2,4两行,中间的空隙怎么弥补??我想让它看起来紧凑点.

python requests模拟登陆github

1. Cookie 介绍 HTTP 协议是无状态的.因此,若不借助其他手段,远程的服务器就无法知道以前和客户端做了哪些通信.Cookie 就是「其他手段」之一. Cookie 一个典型 ...

U盘披上人民币外衣

本报讯(实习生张雷)近日,一款印有第三版人民币图案的卡片式U盘在中关村销售,商家称其为创意商品,而律师表示,这已触犯法律. 昨天下午,记者在中关村鼎好大厦4层一处销售U盘的柜台看到,在各种各样的U盘中 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.025 s.