正则表达式——去除文本中的非汉字(VB2005)

  本人由于工作关系,需要一段代码,将给定的字符串中的非汉字去除,只保留汉字部分。

  这个一般用正则表达式比较简单,网上有一些匹配汉字的正则表达式,拿来经过改造就能实现我前面的要求。

  

  注释一下,正则表达式[\u4e00-\u9fa5]表示匹配中文,则正则表达式[^\u4e00-\u9fa5]匹配非中文。用Replace方法将匹配的非中文替换为空字符串,也就是去除了文本中的非中文字符。

  代码格式修正于2012年1月5日 

Imports System.Text.RegularExpressions
Public Class clsT
  Public Function OnlyChinese(ByVal mText As String) As String
    Return Regex.Replace(mText, "[^\u4e00-\u9fa5]", "")
  End Function
End Class

时间: 2024-11-01 18:32:26

正则表达式——去除文本中的非汉字(VB2005)的相关文章

如何使用正则表达式剔除文本中的HTML标记

html标记|正则 因为我的前段时间发的XMLHTTP批量抓取远程资料的文章http://blog.csdn.net/babyt/archive/2004/09/08/98516.aspx最近有人来问我如何将文章用文本格式保存,而不是直接使用HTML存储,这样的话会节约数据库空间.于是写了这么个函数来将文本中的HTML标记剔除 函数虽然简单,但是对处理HTML文档还是很有效的<%Function RemoveHTML(strHTML) Dim objRegExp, Match, Matches

用正则表达式剔除文本中的HTML标记

因为我的前段时间发的XMLHTTP批量抓取远程资料的文章http://blog.111cn.net/babyt/archive/2004/09/08/98516.aspx最近有人来问我如何将文章用文本格式保存,而不是直接使用HTML存储,这样的话会节约数据库空间.于是写了这么个函数来将文本中的HTML标记剔除函数虽然简单,但是对处理HTML文档还是很有效的<%Function RemoveHTML(strHTML) Dim objRegExp, Match, Matches Set objReg

JavaScript利用正则表达式去除日期中的-_javascript技巧

1.说明 经常会出现这样的情况,页面的日期格式是:YYYY-MM-DD,而数据库中的日期格式是:YYYYMMDD,两者之间需要转换一下,方能传到Java后台查询数据. 通常,这种转化的方法有两种,第一种,将日期字符串先截取,然后拼接:第二种,就是利用正则表达式去掉"-" 相比较而言,第二种方法快捷,不容易出错. 2.实现源码 复制代码 代码如下: <%@ page language="java" import="java.util.*" p

ASP小偷程序需要用到的函数:用于可控制删除文本中的html标签

程序|函数|控制|小偷程序 函数用于去除文本中的html标签,可以控制删除哪些标签. 要控制被删除的标签列表,可以通过向TAGLIST常数中添加/删除标记来实现. 例如,要保留所有的<B>标签,则从TAGLIST中删除B. 当前的列表包含了MSDN中的所有html标签以及 LAYER 标签. 每个标签要用";"括起来. 开始标签和结束标签都会被删除,例如"<A...>"和</A...> 若标签同时在 TAGLIST 和 BLOCK

《正则表达式经典实例(第2版)》——2.20 在替代文本中添加正则匹配

2.20 在替代文本中添加正则匹配 问题描述 执行查找和替换,把所有URL都转换成指向该URL的HTML链接,并使用该URL作为链接的文本.在这个练习中,把URL定义为"http:"以及其后所有的非空字符.例如,Please visit应该被转换为Please visit. 解决方案 正则表达式 http:\S+ 正则选项:无 正则流派:.NET.Java.JavaScript.PCRE.Perl.Python.Ruby 替代文本 <a●href="$&&quo

判断文本中不存在指定字符串(忽略大小写)的正则表达式的问题

问题描述 判断文本中不存在指定字符串(忽略大小写)的正则表达式的问题 最近遇到个正则表达式的问题,判断不存在指定字符串的正则表达式是这样:((?!MySQL).)*,但忽略大小写判断(?!)加上去后,死活不成功,((?!(?!)MySQL).)*,这个是加上忽略大小后的写法,谁能帮我看看到底是怎么回事 解决方案 ?i 这个应该是忽略大小写的 解决方案二: 谢谢,才发现我写错了,?i写成?!

asp 去除字符串中的空格和数字正则表达式

本文章为你提供一款超好的asp教程 去除字符串中的空格和数字正则表达式哦,这四款替换空格与数字的正则是各有不同哦. <script language="网页特效" type="text/javascript"> var str; str="10    3333    abc123"; var rg; rg=/[0-9]{1,}|s/ig; var newstr=str.replace(rg, ""); docume

javascript去除字符串中所有标点符号和提取纯文本的正则_javascript技巧

用正则表达式除字符串中所有标点符号 复制代码 代码如下: <script language="javascript">   var str="jfkldsjalk,.23@#!$$k~!  @#$%^&*()(_+-=|\{}[]';:,./<>??gg  g~```gf";   str=str.replace(/[\ |\~|\`|\!|\@|\#|\$|\%|\^|\&|\*|\(|\)|\-|\_|\+|\=|\||\\

《正则表达式经典实例(第2版)》——2.19 在替代文本中添加字面文本

2.19 在替代文本中添加字面文本 问题描述查找并把任何正则表达式匹配从字面上替换为这8个字符:$%*$11. 解决方案 $%\*$$1\1 替代文本流派:.NET.JavaScript \$%\\*\$1\\1 替代文本流派:Java $%\*\$1\\1 替代文本流派:PHP \$%\*\$1\\1 替代文本流派:Perl $%\*$1\\1 替代文本流派:Python.Ruby 讨论在替代文本中转义字符的时机和方式这个实例显示了各种替代文本流派中使用的不同转义规则.在替代文本中,你可能会需