C# 获取a标签的正则表达式求助

问题描述

C# 获取a标签的正则表达式求助

例如该链接为< a href="http://www.baidu.com" title="标题">标签内容</ a>,求一个正则表达式能匹配到到a标签href、title和“标签内容”的内容,title的位置可能在href前面,也有可能在href后面,或者就没有title

解决方案

用jQuery不行么?
获取a标签.

解决方案二:

直接用xml类库解析xml节点。比正则容易。

解决方案三:

 (?<=<as(href|title)[^>]+?>)(?=</a>)

解决方案四:

MatchCollection mc = Regex.Matches(@"< a href="http://www.baidu.com" title="标题">标签内容</ a>",
@"(?isn)[^""]+)stitle=""(?[^""]+)[^>]+>(?.+?)");
foreach (Match m in mc)
{
MessageBox.Show(m.Groups["url"].Value + Environment.NewLine +
m.Groups["title"].Value + Environment.NewLine + m.Groups["text"].Value);
}

时间: 2024-10-01 15:29:40

C# 获取a标签的正则表达式求助的相关文章

td的值-正则表达式求助,获取&amp;amp;lt;td&amp;amp;gt;的值!!

问题描述 正则表达式求助,获取<td>的值!! 正则表达式获取td里面的值,td里面的class不一样,不知道怎么写..... enter code here 品种:棉花CF????日期:2014-07-28 1 海通期货 5,774 2,061 万达期货 13,386 -747 永安期货 18,932 150 2 华安期货 5,257 3,188 国投期货 12,172 635 银河期货 13,891 329 //reg 不会写啊啊啊··· Regex reg = new Regex(@&q

求一个匹配包含指定字符串的html标签的正则表达式

问题描述 求一个匹配包含指定字符串的html标签的正则表达式 我遇到的问题是这样的,代码描述如下: <div class="wz_con"> <div class="art_remark">概述内容</div> <div>插入的图片</div> wz_con的要提取的内容 </div> 我想要获取 标签之间的内容,但不包含另外两个div及其内容,在不过滤的情况下,求一个正则表达式. 解决方案 [

PHP中过滤常用标签的正则表达式_正则表达式

我们常常会用到PHP过滤一些标签的功能,比如过滤链接标签.过滤script标签等等,下面就介绍一下PHP过滤常用标签的正则表达式代码: $str=preg_replace("/\s+/", " ", $str); //过滤多余回车 $str=preg_replace("/<[ ]+/si","<",$str); //过滤<__("<"号后面带空格) $str=preg_replace

python-请问用BeautifulSoup如何获取p标签内的值

问题描述 请问用BeautifulSoup如何获取p标签内的值 从网上爬下来了一道数学题,不知道该怎样获取里面的值了 soup = BeautifulSoup(problem_content, 'html.parser') # 这个problem_content是个从网上爬下来的数学题,里面包含很多的HTML标签 # print soup # 全部是乱码,网上找资料说是没有xa0这个编码 # print soup.prettify().replace(u'xa0', '') # 安装文档形式输出

面向html标签的正则表达式

正则 如何构建一种面向 html 标签的正则表达式语法?     在处理字符串的过程中,正则表达式有着不可替代的位置.现在的计算机高级语言中都有相应的正则表达式支持包.     如果我们把一个网页中 html 代码当作一个有结构的字符串,那么如何用一种类似正则表达式的方式来提取想要的html标签(tags)呢?     这里先不考虑如何实现,而先考虑如何用一种类正则表达式的方式来描述html标签.要取得一个html标签(tag),需要知道该标签的2类属性: 1.标签的位置: 2.标签本身的属性:

从html代码中获取Img标签

  /// <summary> /// 获取Img标签 /// </summary> /// <param name="htmlText">截获到的html代码</param> /// <returns></returns> public static List<string> GetPadImg(string htmlText) { List<string> list = new List

js获取select标签的值且兼容IE与firefox

 本篇文章主要介绍了js获取select标签的值且兼容IE与firefox.需要的朋友可以过来参考下,希望对大家有所帮助 jsp代码: 代码如下: <form id="search">  <select id="jobSelect" style="width: 200px;" name="jobSelect">   <s:if test='jobSelect == null || jobSelec

js获取select标签选中值的两种方式

 获取select标签选中的值有很多方法,下面通过两种方式使用js来进行获取,喜欢的朋友可以参考下 代码如下: var obj = document.getElementByIdx_x("testSelect"); //定位idvar index = obj.selectedIndex; // 选中索引var text = obj.options[index].text; // 选中文本var value = obj.options[index].value; // 选中值jQuery

火狐浏览器-获取浏览器标签页窗口标题

问题描述 获取浏览器标签页窗口标题 最近做个客户端的软件,需要遍历浏览器所有标签页的标题.使用QT开发,用win api去遍历窗口.IE和谷歌都可以,现在发现火狐浏览器只能获取当前标签页的,其他的获取不到.求各位大神前来指点! 解决方案 使用NDde.Clienthttp://stackoverflow.com/questions/13307946/get-the-urls-of-opened-tabs-in-browser 解决方案二: 先看能不能拿到其他标签页的窗口,用spyxx查看一下窗口